大阪地方裁判所 平成7年(ワ)13135号 判決 1999年3月18日
兵庫県尼崎市立花町二丁目一二番二五号
原告
有限会社 池上パテントインキュベーター
右代表者取締役
池上喜美子
右訴訟代理人弁護士
村林隆一
同
松本司
同
松本好史
大阪市阿倍野区長池町二二番二二号
被告
シャープ株式会社
右代表者代表取締役
辻晴雄
右訴訟代理人弁護士
高坂敬三
同
鳥山半六
同
岩本安昭
右補佐人弁理士
深見久郎
同
森下八郎
主文
一 原告の請求をいずれも棄却する。
二 訴訟費用は原告の負担とする。
事実及び理由
第一 請求
一 被告は、別紙イ号物件目録(原告)記載の物件を製造販売してはならない。
二 被告は、原告に対し、金七五〇〇万円及びこれに対する平成七年一二月二八日から支払済みまで年五分の割合による金員を支払え。
第二 事案の概要
一 基礎となる事実(いずれも争いがないか、後掲の証拠又は弁論の全趣旨により認められる。)
1 原告の特許権
原告は、次の特許権(以下「本件特許権」という。)を有している。
(一) 発明の名称
情報処理装置
(二) 出願日
昭和五五年一二月一三日(特願昭六三-六五九五号)
なお、本件の特許出願は、特願昭五五-一七六二九六号(以下「原出願」という。)からの分割出願である。
(三) 公告日
平成二年二月一五日(特公平二-七一〇七号)
(四) 登録日
平成二年一〇月二二日
(五) 特許番号
第一五八三一七七号
(六) 特許請求の範囲(請求項1)
本件特許権の特許出願の願書に添付した明細書(以下「本件明細書」という。)の特許請求の範囲(請求項1)の記載は、本判決添付の特許公報(以下「本件公報」という。)の該当欄記載のとおりである(以下同特許請求の範囲欄中、請求項1記載の特許発明を「本件発明」という。)。
2 本件発明の構成要件の分説
本件発明の構成要件は、次のとおり分説するのが相当である。
A 処理すべき未処理情報を入力する入力手段と、
B 前記入力手段に入力された情報を認識する認識手段と、
C 前記認識手段で認識された未処理情報に基づいて、それに対応する処理済情報に処理する情報処理手段と、
D 前記認識手段から出力される認識後の情報中に存在する終端情報を検出した際、前記情報処理手段に処理動作を実行させる処理実行指示手段と
E を備えてなる情報処理装置
3 本件発明の作用効果
(一) 「本発明によれば、認識後の出力中に存在する終端情報を検出した際、情報処理動作を実行させるので、認識前のノイズの多い情報から終端情報を検出する場合に比較して、検出精度を大巾に向上でき、自動処理を確実に行うことができる」(本件公報8欄17ないし22行目)
(二) 「認識前の情報から終端情報を検出した場合、認識手段での認識動作に要する時間遅れ(タイムラグ)を考慮して(例えば、遅延手段を設けるなどして)情報処理手段への実行指示のタイミングを遅らさなければ、情報処理手段に処理実行をAS7'から指示したが、未だ認識手段で認識動作中であったというのでは、タイミングよく処理を実行させ精度の高い処理済情報を得ることができないのであるが、本発明のものでは、認識後の情報を終端情報の検出対象としているので、終端情報が検出されたときには、必ず、処理すべき情報は全て情報処理手段に入力されているので、遅延手段などの時間制御手段を要せず、タイミングよく処理動作を自動的に実行させることができる。」(同8欄22ないし36行目)
4 原出願の経過
(一) 原出願の願書に最初に添付した明細書(以下「原出願当初明細書」という。)に記載された特許請求の範囲(請求項1)は、次のとおりであった(乙2)。
「元言語入力部を電子翻訳部を介して、翻訳言語出力部に接続させると共に、元言語入力信号の終端検出手段と電子翻訳部に翻訳動作を行わせる翻訳指示手段とを備えた翻訳制御部を前記電子翻訳部に接続させたことを特徴とする電子翻訳装置」
(二) 原出願に対しては、昭和六三年一〇月二七日に拒絶査定がされ(甲21の2)、そのまま確定した。
5 被告の行為
被告は、平成四年一二月ころから、機械翻訳システム「DUET Qt」(以下、「イ号物件」という。)を製造販売している。
二 原告の請求
本件は、原告が、被告に対し、イ号物件は本件発明の技術的範囲に属するから、それらの製造・販売は本件特許権を侵害するとして、<1>本件特許権に基づき、それらの製造・販売の差止め、<2>本件特許権の侵害に基づく損害賠償を各請求した事案である。
三 争点
1 イ号物件の構成
2 イ号物件は本件発明の技術的範囲に属するか。
3 被告が原告に対して損害賠償義務を負う場合に支払うべき損害額。
第三 争点に関する当事者の主張
一 争点1(イ号物件の構成)について
【原告の主張】
1 イ号物件の構成は、別紙イ号物件目録(原告)のとおりである。
2 これを本件発明の各構成要件に対応させていえば、別紙イ号物件構成対応目録(原告)のとおりである。
3 被告は、日本語呼出処理においては改行コードを挿入する処理が行われていないと主張するが、日本語呼出処理においても改行コードの挿入は行われている。仮に被告の主張するとおりであるとしても、イ号物件は、日本語呼出処理において「一文ずつに区分して呼び出す処理」を備えている。
【被告の主張】
1 イ号物件の構成は、別紙イ号物件目録(被告)のとおりである。
2 これを便宜的に単純化して本件発明の各構成要件と対応させれば、別紙イ号物件構成対応目録(被告)のとおりである。
3 なお、イ号物件における「改行コード挿入」、「一文切出し」は、次のように区分して行われている。
(一) 日本語登録処理においては、一文か否かにかかわらず特定の文字(句点、ピリオド)の後ろに一律に「改行コード」を挿入する処理。
(二) 日本語呼出処理においては、一定の条件に基づいて翻訳単位となる一文ずつに区分して呼び出す処理。
(三) 英語登録処理においては、一定の条件に基づいて「改行コード」を挿入する処理。
(四) 英文呼出処理においては、(三)と同じ処理。
二 争点2(イ号物件は本件発明の技術的範囲に属するか)について
【原告の主張】
1 文言侵害の成立
争点1に関する原告の主張2(別紙イ号物件構成対応目録〔原告〕)からすれば、次のとおり、イ号物件は本件発明の構成要件を満たす。
(一) 構成要件Aについて
(1) イ号物件の構成aの「文字・句読点・記号・符号を含んだ一連の複数の文(文書)」は、本件発明の構成要件Aの「処理すべき未処理情報」に相当する。
(2) イ号物件の構成aの「イメージスキャナ12」は、本件発明の構成要件Aの「入力手段」に相当する。
(3) よって、イ号物件の構成aは、本件発明の構成要件Aを充足する。
(二) 構成要件Bについて
(1) イ号物件の構成bの「イメージスキャナ12により読み取られた文字・句読点・記号・符号等の形態(画像信号)」は、本件発明の構成要件Bの「前記入力手段に入力された情報」に相当する。
(2) イ号物件の構成bの「あらかじめ記憶している単語(英語の場合)または文字(日本語の場合)の特徴データと比較(類似度計算)することで、文字・句読点・記号・符号を認識し、文字信号(文字情報)に変換する」は、本件発明の構成要件Bの「認識する」に相当する。
(3) イ号物件の構成bの「文字認識装置14」は、本件発明の構成要件Bの「認識手段」に相当する。
(4) よって、イ号物件の構成bは、本件発明の構成要件Bを充足する。
(三) 構成要件Cについて
(1) イ号物件の構成cの「文字認識装置14で文字認識された一連の文書(文字信号)」は、本件発明の構成要件Cの「前記認識手段で認識された未処理情報」に相当する。
(2) イ号物件の構成cの「一文ずつに分割された文書」(主位的特定)又は「一文ずつに区分された文書」(予備的特定)は、本件発明の構成要件Cの「それに対応する処理済情報」に相当する。
(3) イ号物件の構成cの「コンピュータプログラム動作により」、「『改行コード挿入条件を満足する文字』の後ろの位置に、改行コードを挿入(即ち、一文ずつに分割)する機能」(主位的特定)又は「(文字認識装置14で文字認識された一連の文書(文字信号)を、)一文ずつに区分して呼び出す機能」(予備的特定)は、本件発明の構成要件Cの「処理する情報処理手段」に相当する。
(4) よって、イ号物件の構成cは、本件発明の構成要件Cを充足する。
(四) 構成要件Dについて
(1) イ号物件の構成dの「文字認識装置14から出力される文字認識された文書(文字信号)中に存在する」とは、本件発明の構成要件Dの「前記認識手段から出力される認識後の情報中に存在する」に相当する。
(2) イ号物件の構成dの「改行コード挿入条件を満足する文字」(主位的特定)又は「一文呼出し条件を満足する文字」(予備的特定)は、本件発明の構成要件Dの「終端情報」に相当する。
(3) イ号物件の構成dの「コンピュータプログラム動作により」、「『改行コード挿入条件を満足する文字』の後ろに改行コードを挿入することを指示する機能」(主位的特定)又は「一文ずつに区分して呼び出すことを指示する機能」(予備的特定)は、本件発明の構成要件Dの「前記情報処理手段に処理動作を実行させる処理実行指示手段」に相当する。
(4) よって、イ号物件の構成dは、本件発明の構成要件Dを充足する。
(五) 構成要件Eについて
(1) イ号物件の構成eの「機械翻訳システム」は、本件発明の構成要件Eの「情報処理装置」に該当する。
(2) よって、イ号物件の構成eは、本件発明の構成要件Eを充足する。
2 被告の主張1(明細書における記載からの限定解釈とイ号物件の属否)について
(一) 本件発明の特許請求の範囲の記載が、「…するための手段」との用語を使用しているのは、それが本件発明の技術分野での通常の記載方法だからであるにすぎず、本件発明の構成要件は機能的クレームではない。(二) 本件発明の各構成要件は、出願時の技術水準に照らした場合、当業者の観点から見て不明確な点はない。
(1) 構成要件Aの「入力手段」としては、本件発明の特許出願当時、音声入力手段はもちろん、キーボード、マウス、ライトペン、イメージスキャナ(OCRの一部)等が知られていたから、これらも含まれるものとして解釈しても、当業者にとっては自明の範囲に属する。
(2) 構成要件Bの「認識手段」については、本件発明の特許出願当時、既に、文字(文字情報)、音声(音声情報)等の認識装置として、文字読取装置並びに音声認識装置等が知られていたから、これらを含むものとして解釈しても、当業者にとっては自明の範囲に属する。
(3) 構成要件Cの「情報処理手段」については、本件発明の特許出願当時、「情報」とは「一定の約束に基づいて人間がデータに与えた意味」であり、「情報処理」とは「与えられた情報から目的に沿った情報を得ること。データ処理はもとより、翻訳、図形、文字、音声の識別などはこれに含まれる。」という概念として使用されており、当業者にとって不明確な点はない。
(4) 構成要件Dの「終端情報を検出」については、本件発明の特許出願当時、マイコンの応用技術、コンピュータプログラム利用の技術、さらには終端情報を制御に使用する技術は多方面で展開されていたから、終端情報を検出して処理実行を処理する手段にコンピュータプログラムの利用が含まれると解釈しても、当業者にとって自明の範囲に属する。
(三) 被告は、本件発明の各構成要件が包括的・抽象的であると主張するが、広範な技術を含む概念であっても、その意味が明細書の記載、出願時の技術水準からして明確であるなら何らの問題もない。
(四) このように本件発明の各構成要件は、特段の限定解釈を要しないものであるところ、イ号物件は、争点1に関する原告の主張2(別紙イ号物件構成対応目録〔原告〕)のとおりの構成を有するものであるから、本件発明のいずれの構成要件も満たす。
3 被告の主張2(出願経過からの限定解釈とイ号物件の属否)について
被告は、原出願当初明細書の記載から、本件発明の各構成要件を限定解釈すべきであると主張するが、2(二)で述べたとおり、原出願及び本件発明の特許出願当時の技術水準に照らせば、各構成要件の意味を2(二)で述べたように理解することは、当業者にとって自明であったというべきであるから、被告主張のような限定解釈をする必要は何らない。
4 被告の主張3(公知技術からの限定解釈とイ号物件の属否)について
(一) 乙1の発明は、キーボード入力を前提とする発明であるが、キーボードを広い意味でも認識手段に該当するとする認識は当業者にはない。したがって、乙1の発明を根拠に本件発明が全部公知であるとはいえない。
(二) 乙8及び9の発明では、被告が主張するような「読点の検出」はしていない。仮に、乙8及び9の発明が「読点の検出」をしていたとしても、この検出を以後の処理(段落挿入)には利用していない。したがって、乙8及び9の発明を根拠に本件発明が全部公知であるということはできない。
(三) 乙17の発明は、本件発明の認識手段に相当する光学的文字読取装置における認識率の向上を図った発明であるにすぎない。また、乙17の発明には本件発明の処理実行指示手段に相当する構成はない。さらに、乙17の発明では、認識後ではなく、認識前の情報中の一定時間以上の空白(終端情報)を検出しているのである。したがって、乙17の発明は本件発明とは異なり、全部公知の発明たり得ない。
(四) 以上より、公知技術からの限定解釈に関する被告の主張は、いずれも失当であり、本件発明の各構成要件を限定解釈する必要は何らない。
5 被告の主張4(作用効果の観点からの限定解釈とイ号物件の属否)について
(一) ノイズ除去について
(1) 前記基礎となる事実3(一)の作用効果は、認識前情報が画像信号で、認識後情報が文字コード情報となっている場合にも妥当する。すなわち、イメージスキャナの出力には、コピーしたときによくできる小さな黒点や紙面の汚れなどのノイズが混在しているが、このようなノイズは、文字認識装置を通して出力されることはなく、カットされるので、文字認識装置の出力としては、認識された結果としての文字コード情報だけということになる。この場合、検出対象である終端情報も文字コード情報となっているため、検出精度は認識前のノイズの多い情報から検出するのと比較して、大幅に向上することとなる。したがって、文字の場合であっても本件発明の構成を採用すると、前記の作用効果を奏することは、音声の場合と同じである。
(2) 被告は、文字情報の場合、認識前の情報中には終端情報である句点の検出が不可能であると主張する。しかし、例えば、文字の横幅を検出し、この幅から句点の幅を引き、この引いた結果、出力がなくなった部分を句点として検出することは可能である。そして、文字の横幅の検出は、甲29に記載されているように、OCRなどにおいて文字列から一文字毎に文字を切り出す際に用いられる一般的かつよく知られた技術である。ただ、このように画像信号(認識前の情報)中に存在する句点(終端情報)を検出することは可能であっても、紙面の「汚れ」(紙面雑音)、受光素子の「感度むら」や、発光素子の「照明むら」(観測系の雑音)、あるいはプリンタで印字される際の文字の一部又は全部に現れる「濃淡、切れ、かすれ、つぶれ」、文字の形の「変動、ゆがみ」や「上下位置ずれ」等(文字生成過程の雑音)、さらには量子化雑音のために、句点の画像信号は正確な句点の形を反映しないため、この検出は困難であり、誤検出が多くなる。ところが、右のようなノイズのある情報でも、認識装置を通すことでノイズが除去され、句点の文字コード信号に変換されると、検出対象は右のようなノイズのない文字信号であるから、検出は容易で高精度の検出が可能となるのである。
(二) タイミングのよい実行指示について
前記のように、本件発明は、認識後の終端情報を検出の対象とすることを特徴とし、それにより、前記基礎となる事実3(二)の作用効果を奏するものである。
このように、本件発明(構成要件D)においては、終端情報は、「認識手段から出力される認識後の情報中」に存在することを規定しており、終端情報を「検出した際」に処理動作の実行指示をすると記載されているのである。したがって、検出と実行指示とは連続する。
しかし、「認識手段からの出力」と「終端情報の検出(及び実行指示)」とが連続する必要はない。認識手段で認識した情報(終端情報を含む)をメモリ等に一時的に記憶させ、適当な時期に該メモリから呼び出し、この呼び出した情報中に存在する終端情報(この終端情報も「前記認識手段から出力される認識後の情報中に存在する終端情報」である)を検出する場合も、本件発明の技術的範囲に属するのである。
したがって、イ号物件の文字認識装置から出力される情報が、一度、RAMに蓄えられ、後に呼び出されるとしても、該情報は文字認識装置から出力される認識後の情報に変わりはないのであるから、本件発明の構成要件Dの「前記認識手段から出力される認識後の情報」に相当するのである。
【被告の主張】
1 明細書における記載からの限定解釈とイ号物件の属否
(一) 本件発明の構成要件はいずれも、「達成される機能」と「手段」で表現されたいわゆる機能的クレームに属するもので、各構成要件は極めて抽象的・包括的に表現されている。このような場合、その技術的範囲は、発明の開示のために明細書の発明の詳細な説明中に記載された記述から、当業者が容易に実施できる程度に開示された範囲又は自明な範囲に限られなければならない。
(1) 本件明細書において、構成要件Aの「情報を入力する」ものとして開示されているのは音声入力のみであるから、構成要件Aは音声入力装置に限定されるべきである。
(2) 本件明細書において、構成要件Bの「情報を認識する」ものとして開示されているのは音声認識のみであるから、構成要件Bは音声認識装置に限定されるべきである。
(3) 本件明細書において、構成要件Cの「情報処理手段」として開示されているのは電子翻訳装置のみであるから、構成要件Cは翻訳装置に限定されるべきである。
(4) 本件明細書において、構成要件Dの「終端情報を検出し」として開示されているのは、音声入力の空白が所定の時間を超えることを時定数回路を用いて検出することのみであるから、構成要件Dは、時定数回路を用いて音声入力の空白が所定の時間を超えることを検出するごとに、電子翻訳装置の翻訳動作を実行させることに限定されるべきである。
(二) 各構成要件の意義に関する原告の主張は、いずれも本件発明の構成要件が抽象的・包括的であるのを利用して、明細書の記載から当業者が実施可能な程度に読み取ることのできる範囲を超えて、その意味内容を不当に拡張しようとするものである。
(三) イ号物件は、概略、争点1に関する被告の主張2(別紙イ号物件構成対応目録〔被告〕)のとおりの構成を有するものであるから、本件発明のいずれの構成要件も満たさない。
2 出願経過からの限定解釈とイ号物件の属否
(一) 原出願当初明細書においては、次の内容しか開示されていなかったから、本件発明の特許出願が原出願からの分割出願である以上、各構成要件の意味は、次の内容に限定して解釈されるべきである。
(1) 本件発明の「情報入力手段」に対応するものとしては、音声入力装置のみ。
(2) 本件発明の「情報認識手段」に対応するものとしては、音声分析装置を用いる音声認識のみ。
(3) 本件発明の「情報処理手段」に対応するものとしては、電子翻訳装置のみ。
(4) 本件発明の「終端情報を検出」に対応するものとしては、音声入力の空白時間が所定より長いことを音声入力の終端とみなして空白時間の長短を時定数回路を用いて検出することのみ。
(二) 仮に各構成要件の意義について、原告主張のような広い解釈をするならば、それは、原出願当初明細書に開示されていた範囲を逸脱することとなり、本件発明の特許出願は不適法な分割出願となる。
(三) イ号物件は、概略、争点1に関する被告の主張2(別紙イ号物件構成対応目録〔被告〕)のとおりの構成を有するものであるから、本件発明のいずれの構成要件も満たさない。
3 公知技術からの限定解釈とイ号物件の属否
(一) 本件発明の特許出願当時、次の技術が公知であった。
(1) 日本語ワードプロセッサーにおいて、キーによる入力がなされるとき、当該仮名キーに対応する文字が識別されて、その文字コード信号が発生し、仮名で表現された日本語文章が記憶され、句読点が入力されたとき、それまでに入力された仮名の日本語文章の中で漢字に該当する部分が漢字に変換されるように構成された技術(乙1)。
(2) 日本語文章の構文を機械的に解析する装置において、日本語文章中の読点を検出して、段落切り回路の段落信号挿入回路にて段落レベルコードを付与した後、書き込み回路にて段落結果を記憶装置の解析結果保存用領域に書き込む技術(乙8)。
(3) 日本語文章の構文を機械的に解析し、その結果に従って文章を読みやすい形式に整えて表示する装置において、段落切り回路により各段落の末尾語にその段落に対する段落レベルコードが付与され、解析結果出力回路では、解析結果保存用領域からの段落レベルコードを検出して、文章文字コード列の中に必要なコントロールコード(改行コード)が挿入される技術(乙9)。
(4) 文字又は記号等の記載されている用紙上を手で持って移動し、文字又は記号等の情報を光学的に読み取る光学的文字読取装置において、文字の識別出力が一定時間以上ない場合、一行の読取りが終了したことを示すLF信号をデータ中に加える処理を行う技術(乙17)。
(二) 原告のように本件発明の各構成要件を広く解釈するときには、これらの公知技術もその内容に含むこととなり、本件発明は全部公知の発明となる。本件発明の技術的範囲を定めるに当たっては、特許請求の範囲の文言上は含まれる技術であっても、これらの公知技術に属するものは含まれないと解釈されるべきであるから、本件発明の各構成要件の意義は、1で述べた意義に限定して解釈すべきである。
(三) イ号物件は、概略、争点1に関する被告の主張2(別紙イ号物件構成対応目録〔被告〕)のとおりの構成を有するものであるから、本件発明のいずれの構成要件も満たさない。
4 作用効果の観点からの限定解釈とイ号物件の属否
(一) ノイズ除去について
言語文章の文字情報の場合には、音声情報と異なり、前記基礎となる事実3(一)のような作用効果は生じない。
(1) 文字情報においては、音声と異なり、周囲ノイズが存在すること自体、極めて異例なことであって、それが存在するのが常態である音声情報とは本質的に異なる。
ごくまれに生じる周囲ノイズが存在した場合について考えても、認識前のわずかな周囲ノイズが含まれる状態で文字配列中に含まれる句点を抽出する場合、そもそもそのようなわずかなバックノイズの存在によって文字中の句点の抽出(区別)の程度は、ほとんど影響を受けることがない。つまり、音声認識後の空白(無信号状態)を検出する場合と異なり技術的課題が存在しないし、認識の前後でほとんど差異は存しないから、本件発明の作用効果を奏することはほとんどない。
(2) 音声情報の場合、終端情報としての長短の空白は音声認識の前後を問わずそのまま残存し、終端情報が認識の前後を問わず検出可能である(だからこそ認識の前後での検出精度の比較が可能となる。)という特徴を有するが、イ号物件のような文字情報では、仮に句点を終端情報と仮定しても、句点は、文字認識を経て初めて「句点」として他の文字との識別が可能となるのであって、それ以前には他の文字と同じく画像信号のみである。そして、そもそも認識前には文字と句点とを識別する技術は存在せず、このことはノイズの有無とかかわらない。つまり、文字認識前にはノイズがなくても文字と句点とを識別することはできないという特徴を有する。このように、そもそも認識前には「検出」可能な「終端情報」としての「句点」そのものが存在せず、「認識」をすることによって、認識前と比較し、句点を検出する上で障害となるノイズが除去され句点の検出精度が高まるというような関係は全く認められない。
(3) 本件発明の特有の作用効果は、「認識前のノイズの多い情報から終端情報を検出する場合に比較して、検出精度を大巾に向上でき」る点にあるのであるから、ここで議論の対象となるべき「ノイズ」はあくまでかかる「終端情報」たる「空白」を検出する上での障害となるものである。しかも、そこで問題とされている「ノイズ」は、「誤認識」を招来するようなノイズではなく、「認識する上で障害とならないノイズ」「認識許容限度内のノイズ」のみを意味する。
ところが、イ号物件は、画像情報の文字認識に当たって、『類似度比較』によって文字及び句点を共にコード信号とした上で句点のコード信号を他の文字のコード信号から識別するものであるから、入力された情報が入力された情報として認識される限度内(前述の「認識許容限度内」)におけるノイズは、何ら句点(のみに限らないが)識別の障害とならない。つまり、イ号物件には本件発明でいうところの「ノイズ」はない。先にみたように、本件発明にいう「ノイズ」は、「認識の障害(誤認識)とならないノイズ」であって、かつ、終端情報(空白)を検出する上で障害となるものでなければならないからである。
以上要するに、イ号物件では、本件発明でいうところの「ノイズ」は何ら句点識別の障害とならないから、技術的課題自体が存在せず、本件発明の特有の作用効果を奏することもないのである。
(二) タイミングのよい実行指示について
(1) 前記基礎となる事実3(二)のような本件発明の効果からすれば、構成要件Dは、認識手段の動作(時間的遅れを伴う)と情報処理手段の動作が終端に空白を有する情報部分(すなわち一文)に関して時間的に連続して順次的に行われるように構成されており、認識手段からの認識後の出力が情報処理手段に対して直接的にかつ時間的に連続して与えられるものに限定する意味に解すべきである。
(2) これに対して、イ号物件は、終端に終端情報を有する認識手段からの出力が情報処理手段に対して直接的にかつ時間的に連続して与えられる構成ではなく、かつ、認識手段の出力から終端情報が検出されるタイミングで情報処理手段の情報処理を実行させるものではないから、二つの処理(認識と情報処理)を順次的にかつタイミングの矛盾なく進行させることができるという効果を奏するものではない。
すなわち、まず、原告が主位的に侵害であると主張すると解される登録処理における「改行コードの挿入」について言えば、文字認識装置から出力された文字コードデータは、すべていったん、本体内のRAMに記憶されて蓄えられ、すべての出力が終了した後、オペレーターの登録処理の選択及びその実行の指示により、登録処理の実行に移る。つまり、イ号物件では、文字認識装置からの情報の出力がすべて完了し、RAMに蓄えられた後、その情報を検索の対象にしてその情報の中に予め定められた改行コード挿入位置があるか否かを判断するものであり、文字認識装置から認識結果が出力されるタイミングで終端情報を検出しているものではない。
また、原告が予備的特定として主張するところの日本文呼出し処理における「一文ずつ区分して呼び出す」機能を情報処理手段として把握した場合も同様である。すなわち、日本文呼出し処理は、文字認識された文書について、オペレーターの登録処理の選択及びその実行の指示により原文ファイルに登録され、次いでオペレーターの指示により行われる処理であるから、終端に終端情報を有する認識手段からの出力が情報処理手段に対して直接的にかつ時間的に連続して与えられる構成ではなく、かつ、認識手段の出力から終端情報が検出されるタイミングで情報処理手段の情報処理を実行させるものではなく、二つの処理(認識と情報処理)を順次的にかつタイミングの矛盾なく進行させることができるという効果を奏するものではない。
なお、イ号物件は、以上で説明した文字認識装置からの出力を登録したファイルだけでなく、イ号物件以外の他のワードプロセッサにより作成されたファイルや、キーボード入力により作成されたファイル等、多様な出所からの文字コードデータについて、それを検索し、一文呼出し条件の下に一文ずつ呼び出して行くというものであるから、この点においても、「認識手段から出力される認識後の情報中に存在する終端情報を検出した際、処理動作を実行させる」というものではないのである。
(3) このようにイ号物件は、本件発明の構成要件Dを満たさない。
三 争点3(被告が原告に対して損害賠償義務を負う場合に支払うべき損害額)について
【原告の主張】
1 被告は、原告が本件特許権の譲渡を受けた平成六年二月二一日から平成七年一二月二〇日までの間、イ号物件を単価約七〇〇万円で、約一八○○台販売し、それにより少なくとも三億六七〇〇万円の利益を得た。
2 よって、原告は、被告に対し、右同額の損害賠償請求権を有するところ、本件では内七五〇〇万円の支払いを請求する。
【被告の主張】
原告の主張は争う。
第四 争点に対する当裁判所の判断
イ号物件の構成をどのように特定すべきかについては原被告間に争いがある(争点1)が、ひとまず争点1に関する原告の主張を前提に、争点2のうち作用効果からの限定解釈とイ号物件の属否(被告の主張4)について検討する。
一 本件発明の特徴について
1 前記基礎となる事実、後掲各証拠及び弁論の全趣旨によれば、次の事実が認められる。
(一) 本件発明の特許出願は、原出願(特願昭五五-一七六二九六号)からの分割出願である。
(二) 原出願にかかる発明の内容(補正後のもの)は、次のようなものであった(乙2)。(1) 特許請求の範囲(第1項)
「遠くから送られてくる翻訳すべき元言語に関する情報を受信する受信手段と、前記受信手段で受信された翻訳すべき元言語に関する情報に基づいて、それに対応する翻訳言語に関する情報に翻訳する翻訳手段と、前記翻訳手段で翻訳された翻訳言語に関する情報を出力する出力手段と、前記受信手段で受信された翻訳すべき元言語に関する情報の終端を検出する終端検出手段と、前記終端検出手段で終端を検出した際、前記翻訳手段に翻訳動作を実行させる翻訳指示手段とを備えてなる電子翻訳装置」(昭和六二年五月三一日付け手続補正書による補正後のもの)
(2) 発明の課題及び効果
ア 「本発明は電子翻訳装置の改良に関するものであり、特に元言語入力信号の終端を検出し、自動的に電子翻訳を開始させるようにした電子翻訳装置に関するものである。」
イ 従来の電子翻訳装置においては、「話者は元言語をインプットするたびに、必ず手で、そのつど翻訳スイッチを操作しなければ翻訳言語を得ることができなかった。」、「音声認識回路を備えた音声入力可能な電子翻訳装置においては、元言語のインプットは音声で直接インプットできるから手操作は不要となるが、翻訳指示操作のためにどうしても手を用いなければならない。」、「本発明はかかる欠点を除去するものであ」る。
ウ 「本発明によれば、遠くから送られてくる翻訳すべき元言語情報を受信する受信手段と、翻訳手段と、元言語情報の終端を検出する終端検出手段と、終端を検出した際、翻訳動作を実行させる翻訳指示手段とを備えているので、元言語情報を入力する送信機から遠くはなれた場所で、何ら手操作を要せず、自動翻訳受信を行うことができ、音声認識手段を用いれば、自動翻訳放送、自動翻訳電話などを実現することができ、翻訳装置、翻訳通信装置の自動化を実現することができるなど、その実用的価値は極めて大きい。」
(三) 原出願に対しては、昭和六二年一〇月六日付けで拒絶理由通知がなされ(甲21の1)、さらに昭和六三年一〇月二七日付けで拒絶査定がなされた(甲21の2)。拒絶査定の理由は、次のようなものであった。
「…、音声終端による実行は公知(第二引例)であり、一般的にも終端情報の検出による動作実行はデータファイル終端(EOF)、データ伝送端(EOT)等の情報によって通常なされている自明事項にすぎない。」
この拒絶査定は、そのまま確定した。
2 以上のような原出願の内容及び拒絶査定の理由、原出願にかかる発明と本件発明との比較からすると、本件発明は、入力情報中に含まれる終端情報を検出して自動的に情報処理動作を実行するという公知技術を前提に、終端情報を検出する対象を、入力情報を認識する前の情報ではなく、入力情報を認識した後の情報とすることによって、前記基礎となる事実に記載した、<1>ノイズ除去、<2>タイミングのよい実行指示という二つの作用効果を有する点に着目して特許が付与されたものと理解するのが相当である。そして、本件発明の本質的要素がこのようなものである以上、これらの作用効果を奏しない技術は、たとえ文言上は本件発明の構成要件を充足するように見えても、本件発明の技術的範囲には属さないと解するのが相当である。
二 ノイズ除去の効果について
前記のとおり、本件発明のノイズ除去効果というのは、認識前の情報から終端情報を検出するのと比較して、認識後の情報から終端情報を検出する場合には、終端情報の正確な検出を妨げるノイズが認識過程において除去されることから、終端情報の検出精度が向上するというものである。このように、本件発明は、認識前の情報から終端情報を検出する場合を前提とし、それとの比較において検出精度を高める点に特徴があるから、イ号物件がこのような作用効果を有するといえるためには、まず、原告主張にかかるイ号物件のように文字を画像情報として入力して句点等を検出する場合においても、認識前の情報から終端情報を検出できることが必要である。
ところで、原告の主張(別紙イ号物件構成対応目録〔原告〕)によれば、イ号物件において、認識前の情報とは文字をイメージスキャナによって読み取った画像信号(画像情報)であり、認識後の情報とは右の画像情報を類似度計算によって認識した文字信号(文字コード情報)であり、終端情報とは「改行コード挿入条件を満足する文字」又は「一文呼び出し条件を満足する文字」(以下「句点等」という。)である。そして、原告は、甲29を挙示して、句点等を認識前の画像情報から検出することは可能であると主張する。
そこで検討するに、まず、本件明細書を通覧するも、文字を画像情報として入力する場合について具体的に触れた記載は見当たらない。
また、甲29は、昭和五七年三月二〇日に発行された橋本新一郎編著「文字認識概論」の抜粋であり、その六二頁以下には、「文字切出し」として、「対象文字パターンの外接枠の位置、すなわちパターンの左右端、続いて上下端の座標を検出する処理」の解説が記載されている。具体的には、主としてパターン左右端の検出方法について、文字パターンのX軸上への射影から求め、射影が連続の場合、不連続の場合、隣接文字が重なる場合の各処理方法が解説されている。原告は、このような記載に基づき、「文字の横幅を検出し、この幅から句点の幅を引く。この引いた結果、出力がなくなった部分を句点として検出する方法」があり、認識前の情報中でも終端情報である句点の検出は可能であると主張するが、右に記載されている内容は、文字認識の前処理として、一文字の領域を左右幅と上下幅を検出することにより抽出する技術にすぎず、文字の横幅を検出することから直ちに句点等を検出する技術が開示されているものとも、容易に想到し得るものともいえない。
そして他に、被告がイ号物件の製造販売を開始したとされる平成四年一二月当時において、画像情報として入力された文字情報から直ちに句点等を検出する技術が知られていたと認めるに足りる証拠はない。
以上よりすれば、イ号物件のように、文字を画像情報として入力して句点等を検出する場合には、そもそも認識前の情報から終端情報を検出することが考えられないのであるから、認識後の情報から終端情報を検出しているからといって、それによる検出精度の向上という作用効果は生じる余地がないと解される。
したがって、イ号物件についての原告の主張を前提としても、イ号物件は、本件発明の技術的範囲に属しない。
三 タイミングのよい実行指示について
1 本件発明のタイミングのよい実行指示の効果というのは、認識前の情報から終端情報を検出するのと比較して、認識後の情報から終端情報を検出する場合には、終端情報が検出された際には認識手段による認識と情報処理手段への入力が済んでいるので、情報処理手段への自動処理実行指示に当たり、認識手段での認識に要するタイムラグを考慮する必要がないというものである。
ところで、認識前の情報から終端情報を検出する場合の問題点は、情報処理手段への実行指示に当たってタイムラグを考慮する必要があるということであるが、これは、認識と情報処理とが時間的に順次連続して行われる状況に固有の問題点であると考えられる。なぜなら、認識と情報処理が時間的に順次連続して行われず、例えばひとかたまりの情報がすべて認識された後にまとめて情報処理が行われる場合のように、認識と情報処理とが時間的に断絶している場合には、認識前の情報から終端情報を検出しても、全入力情報の認識が終了するまで情報処理を行わないのであるから、そのタイミングで情報処理を実行するということは不可能か又は無意味であり、終端情報を検出して自動的に情報処理を実行させようと思えば、必然的に認識後の情報から終端情報を検出するようにせざるを得ないからである。したがって、認識と情報処理とが時間的に順次連続して行われない状況下では、情報処理手段へ自動処理の実行を指示するに当たって、認識前の情報から終端情報を検出したタイミングを使う場合と、認識後の情報から終端情報を検出したタイミングを使う場合とを比較できる状況にはなく、本件発明の作用効果を奏する状況ではないというべきである。 この点原告は、本件発明においては、終端情報の検出と情報処理の実行指示とは連続している必要があるが、認識と終端情報の検出・情報処理の実行指示とは連続している必要はないと主張する。確かに、本件発明の構成のうち、認識後の情報から終端情報を検出するという文言だけを見れば、認識から情報処理までが時間的に連続していなくともよいようにも考えられる。しかし、前記のように、本件発明は、認識前の情報から終端情報を検出する場合の問題点を解決した点に着目して特許が付与されたものであるから、認識前の情報から終端情報を検出する場合の問題点が生じる状況にあるということが、本件発明の前提要件となっているというべきである。そして、認識と情報処理とが時間的に順次連続していない状況の場合には、その前提要件を満たさないことは前示のとおりである。したがって、原告の右主張は採用できない。
2 そこでイ号物件が右前提要件を具備するか否かについて検討するに、原告の主張(別紙イ号物件目録〔原告〕)によれば、イ号物件においては、<1>イメージスキャナによって文字画像情報が入力された後、<2>文字認識装置によって情報が認識され、認識結果たる文字信号(文字情報)に変換され、<3>オペレーターが対話型処理を選択し、特定の一つの文書ファイルを選択すると、イ号物件は、文字認識装置で文字認識された一連の文書(文字信号)中に存在する(a)「改行コード挿入条件を満足する文字」を検出した際、該文字の後ろに改行コードを挿入する処理、又は(b)「一文呼出し条件を満足する文字」を検出した際、一文ずつ区分して呼び出すことを指示する処理を行うものとされている。このような原告の主張によっても、イ号物件は、認識の対象となる一連の文書がすべて文字認識された後、句点等が検出されて改行コードの挿入等がなされるものとされており、認識と情報処理とが時間的に順次連続して行われているわけではない。なお、この点については、被告の主張(争点2に関する被告の主張4(二))においてはより明確にされているところである。
3 したがって、イ号物件に関する原告の主張を前提としても、イ号物件は、認識と情報処理とが時間的に順次連続して行われるものではないから、本件発明の構成要件Dを満たさない。
第五 結論
以上によれば、その余について判断するまでもなく、原告の請求は理由がないから、主文のとおり判決する。
(平成一〇年一二月八日口頭弁論終結)
(裁判長裁判官 小松一雄 裁判官 高松宏之 裁判官 瀬戸啓子)
(別紙) イ号物件目録(原告)
※以下、「イ号システム」とは「イ号物件」のことを指す。
第一 図面の説明
第1図 イ号システム構造図
第2-1図 対話型処理のブロック図(主位的特定)
第2-2図 右と同じ,(予備的特定)
第二 イ号システムの構成
一 イ号システムは、翻訳のためのプログラムを実行することにより翻訳装置として動作する実質的にコンピユータからなる翻訳装置本体10と、翻訳装置本体10と直列に接続されるイメージスキャナ12および文宇認識装置14と、翻訳装置本体10に接続され翻訳原文および翻訳結果を印刷する漢宇プリンタ16等からなる日英または英日機械翻訳システムである。
なお、図中7は液晶ディスプレイ、18は本体10のマウスコネクタに接続されるマウスである。
二 イ号システムの動作・機能について
イ号システムには日本語から英語に翻訳する「日英」タイブと、逆に英語から日本語に翻訳する「英日」タイプがある。
1(1) イメージスキャナ12は、文字・句読点・記号・符号を含んだ一連の複数の文(文書)から、文字・句読点・記号・符号等の形態を光学的に画像信号(画像情報)として読み取る。
なお、「文字・句読点・記号・符号を含んだ一連の複数の文」とは、例えば次のような文書をいう。
英語の本が発売された。私は本を買った。彼は外国語を勉強している。フランス語を理解できる。とても美しい言語だ。
(2) 文字認識装置14は、イメージスキャナ12により読み取られた文字・句読点・記号・符号等の形態(画像信号)を、あらかじめ記憶している単語(英語の場合)または文字(日本語の場合)の特徴データと比較(類似度計算)することで、文字・句読点・記号・符号を認識し、文字信号(文字情報)に変換する。
2 オペレーターが対話型処理を選択し、特定の一つの文書ファイルを選択すると、イ号システムは次の動作を自動的になし、この動作により処理された例えば日本語の文書が、ディスプレイ7の原文領域7aに出力される。
(1) コンピュータプログラム動作により、文字認識装置14で文字認識された一連の文書(文字信号)中の「改行コード挿入条件を満足する文字」の後ろの位置に、改行コードを挿入(即ち、一文ずつに分割)する。
改行コードを挿入(即ち、一文ずつに分割)されると、例えば次のような一文ずつに整えられた文書となる。
英語の本が発売された。
私は本を買った。
彼は外国語を勉強している。
フランス語を理解できる。
とても美しい言語だ。
「改行コード挿入条件を満足する文字」とは、
<1> 日本文呼出し処理(日英翻訳システム)において、
(ⅰ)原則
オペレーターが「文区切り文字」(初期状態では「./:/!/?/:/;」の6種類)として設定した文字が右「改行コード挿入条件を満足する文字」となる。
(ⅱ) 例外
「文区切り文字」として設定した文字であっても「文区切り文字」が連続する場合(例「。。」)の最後にならないときとか、「文区切り文字」の後ろに閉じ括弧類のあったときは、「改行コード挿入条件を満足する文字」とはならず、逆に、オペレーターが「文区切り文字」として設定しなかった文字であっても文中のタブ、改行は「改行コード挿入条件を満足する文字」となる。
<2> 英文呼出し処理(英日翻訳システム)において、
(ⅰ)原則
「.」「:」「;」等の文字が「改行コード挿入条件を満足する文字」となる。
(ⅱ)例外
右「.」等の文字であっても「改行コード挿入条件を満足する文字」とならない場合として「文中文字」(例「Mr.」の場合のピリオド)等がある。
なお、日本文呼び出し処理との差異は、オペレーターによって「.」「:」「;」等の文字が設定変更できないことである。
<3> 右<1><2>の処理と同様の処理として日本語登録処理又は英語登録処理がある。
(2) 右の処理は、文字認識装置14から出力される文字認識された文書(文字信号)中に存在する「改行コード挿入条件を満足する文字」を検出した際、該文字の後ろに改行コードを挿入することを指示するコンピュータプログラム動作によりなされる。
(3) 分割された一文毎の文頭に文番号を付与する。
例えば、左のように文番号を付与する。
1 英語の本が発売された。
2 私は本を買った。
3 彼は外国語を勉強している。
4 フランス語を理解できる。
5 とても美しい言語だ。
2' 日本文呼出し処理において、オペレーターが対話型処理を選択し、特定の一つの文書ファイルを選択すると、イ号システムは次の動作を自動的になし、この動作により処理された日本語の文書が、ディスプレイ7の原文領域7aに出力される。
(1') コンピュータプログラム動作により、文字認識装置14で文字認識された一連の文書(文字信号)を、一文ずつに区分して呼び出す処理をする。
一文ずつに区分して呼出されると、例えば次のような一文ずつに整えられた文書となる。
英語の本が発売された。
私は本を買った。
彼は外国語を勉強している。
フランス語を理解できる。
とても美しい言語だ。
(2') 右の処理は、文字認識装置14から出力される文字認識された文書(文字信号)中に存在する「一文呼出し条件を満足する文字」を検出した際、一文ずつに区分して呼び出すことを指示するコンピュータプログラム動作によりなされる。
「一文呼出し条件を満足する文字」とは、前記2(1)<1>の「改行コード挿入条件を満足する文字」と同じである。
(3') 区分された一文毎の文頭に文番号を付与する。
右は2(3)と同じである。
3 オペレーターが、液晶ディスプレイ7の原文領域7aに出力された前記2又は2'で処理された文書のうち翻訳する範囲を指定すると、イ号システムは自動的に、一文毎に、英語または日本語の文字情報に翻訳するとともに、この翻訳後の英語または日本語の文字情報を液晶ディスプレイ7の訳文領域7bに出力する。
4 翻訳処理後の液晶ディスプレイ7の表示画面の内容は、オペレーターの指示により漢字プリンタ16で印刷することができる。
5(1) またオペレーターが前記2又は2'の段階でバッチ翻訳処理を選択し、特定の一ないし複数の文書ファイルを選択すると、イ号システムは自動的に、前記1(2)の変換処理をされた文書を読み出し、前記対話型処理と同様の一連の処理を次々と実行し、自動的に翻訳していく。
(2) そして、オペレーターの指示によりバッチ翻訳処理結果を漢字プリンタ16で印刷することもできる。
以上
第1図
<省略>
第2-1図
<省略>
第2-2図
<省略>
(別紙) イ号物件目録(被告)
※以下「イ号製品」とはイ号物件のことを指す。
『DUET Qt』の商品名をもって製造販売されるイ号製品とは、『別紙イ号図面1ないし3に図示し、後記(一)で説明する外観及び構造を有するとともに、別紙イ号図面4ないし14に図示し、後記(二)で説明する動作方法を採用した翻訳装置』である。
以下、別紙イ号図面1ないし3に基づきイ号製品の外観及び構造を説明し、また同4ないし14に基づき動作方法を順次説明する。
(なお、参照の便宜上、別紙イ号図面の冒頭に各図面と各符号の目録を付した。)
(一)外観及び構造について
イ号製品のハードウェアの外観及び構造は以下のとおりである。
1 イ号製品は、イ号図面1に記載のように、翻訳のためのプログラムを実行することにより翻訳装置として動作する実質的にコンピュータからなる翻訳装置本体10と、SCSI接続ケーブル22及びSCSIコネクタを介して翻訳装置本体10と直列に接続されるイメージスキャナ12及び文字認識装置14と、プリンタ接続ケーブル24を介して翻訳装置本体10に接続され、翻訳原文及び翻訳結果を印刷するためのプリンタ装置16と、本体10のマウスコネクタに接続されるポインティングデバイスとしてのマウス18と、本体10に電源を供給するためのACアダプタとからなる。
2 本体10及びプリンタ装置16の回路ブロック図をイ号図面2に示す。
イ号図面2に示されるように、本体10は、アドレスバス120及びデータバス121を含み、これらにCPU101が接続されている。使用CPUはモトローラ社製のMC68030である。本体10はさらに、バス120及び121に接続されたディスプレイ及びメモリコントローラ102と、ディスプレイ及びメモリコントローラ102に接続されたDRAM103と、ディスプレイ及びメモリコントローラ102ならびにバス121に接続されたVRAM104と、バス120及び121ならびにVRAM104に接続されたI/Oコントローラ105とを含む。
3 I/Oコントローラ105は、コネクタ及びケーブルなどを介して液晶ディスプレイユニット116、キーボードユニット118、テンキーユニット119、及びマウス18に接続されている。液晶ディスプレイユニット116は、ドライバーユニットと、モノクロ液晶表示パネルと、液晶バックライトとを含んでいる。
4 本体10はさらに、バス120及び121に接続されたDMAC(ダイレクト・メモリ・アクセス・コントローラ)107と、アドレスバス120及びDMAC107に接続されたSCSIC(入出力インターフェイス)108及びフロッピーディスクコントローラユニット(FDC)109と、いずれもバス120及び121に接続されたシリアルインターフェイスユニット(SIOC)110、起動プログラム(IPL)ROM111、辞書ROM112及び文字フォント(CG)ROM113とを含む。DMAC107はプリンタ接続ケーブル24を介してプリンタ装置16に接続されている。
5 本体10はまた、コネクタ及びケーブルを介してSCSIC108に接続されたハードディスクユニット114と、FDC109に接続されたフロッピーディスクユニット115とを含む。SCSIC108はまた、コネクタ及びSCSI接続ケーブル22を介して文字認識装置14及びイメージスキャナ12に接続される。ハードディスクユニット114には、OS(オペレーティングシステム)プログラムが予め格納されている。また、ハードディスクユニット114には、日英翻訳のためのシステムでは日英翻訳プログラムが、英日翻訳のためのシステムでは英日翻訳プログラムが、日英と英日との双方向の翻訳のためのシステムではその両者が格納されている。ハードディスクユニット114にはさらに、文字認識プログラムと、他のユーティリティプログラムが格納されている。これらプログラムは、システムの動作時には、必要に応じてDRAM103に転記され、CPU101により実行される。
なお、本体10には、上述した各部品に所定の電圧の電源を供給する電源回路ユニット117が設けられている。また、I/Oコントローラ105には、各部品の動作の基準となるクロック信号を発生する基準クロック発生ユニット106と、ブザーとが接続されている。
6 プリンタ装置16は、プリンタ接続ケーブル24が接続されるインターフェイス206と、インターフェイス206に接続されているバス210と、いずれもバス210に接続されているCPU201、プログラム及び文字フォントを記憶したROM202並びにRAM203とを含んでいる。プリンタ装置はさらに、記録ヘッドユニット208とキャリッジモータ及びペーパフィードモータ207とからなる機械部分と、バス210に接続され、これら機械部分を駆動するメカドライバーユニット205と、バス210及びメカドライバーユニット205に接続されたコントローラ204とを含んでいる。プリンタ装置16もまた、上述の各部品に所定電圧の電源を供給するための電源回路ユニット209を含んでいる。
7 イ号図面3に示すように、イメージスキャナ装置12は、文字認識装置14への接続ケーブル350が接続されるインターフェイスユニット313と、インターフェイスユニット313に接続される周辺制御プロセッサユニット305と、周辺制御プロセッサユニット305が接続されたバス315と、いずれもバス315に接続されたCPU301、プログラムROM302、及びRAM303とを含む。
8 イメージスキャナ装置12はさらに、光学的読取処理を行うための機械的部分として、ランプと、CCD(電荷結合素子。撮像素子の一種)ユニット搬送モータ311と、スイッチセンサー312と、これらを駆動するために周辺制御プロセッサユニット305に接続されて制御されるセンサー・スイッチ・モータ・ドライバーユニット309と、RAM310とを含む。
イメージスキャナ装置12はまた、CCDユニット308と、CCDユニット308の出力をディジタル信号に変換するA/D(アナログ/ディジタル)コンバータユニット306と、RAM307と、バス315、周辺制御プロセッサユニット305、A/Dコンバータユニット306及びRAM307に接続され、A/Dコンバータユニット306の出力するディジタル信号をRAM307を用いて処理するためのイメージデータプロセッサユニット304とを含む。イメージスキャナ装置12もまた、上述の各部品に所定の電圧の電源を供給するための電源回路ユニット314を含んでいる。
イメージスキャナ装置12が読みとった原稿イメージは、接続ケーブル350及びSCSI接続ケーブル22を介して文字認識装置14及び本体10に与えられ、表示及び文字認識処理に用いられる。
9 文字認識装置14は次のような構造を持っている。
文字認識装置14は、内部バスによって相互に接続されたメインCPU401と、プログラムROM402と、パラレルI/F403と、RAM404と、SCSIコントローラ405と、DMAC406と、4つの分散処理ユニットSUB1ないし4と、これら各部品に所定の電圧の電源を供給するための電源回路ユニット416とを含んでいる。パラレルI/F403は、コネクタ及び接続ケーブル350を介してイメージスキャナ装置12に接続される。SCSIコントローラ405は、SCSI接続ケーブル22及びコネクタを介して本体10に接続される。
4個の分散処理ユニットSUB1ないし4が設けられるのは、文字認識処理において使用される類似度法と呼ばれる方法にしたがう文字認識処理をできるだけ高速に行うためである。
10 分散処理ユニットSUB1ないし4はいずれも同じ構成を有している。たとえば分散処理ユニットSUB1は、サブCPU407と、いずれもこのサブCPU407に内部バスにより接続されるプログラムROM408、レジスタユニット409及び413並びにRAM410及び414とを含んでいる。分散処理ユニットSUB1はさらに、レジスタユニット413及びRAM414に接続されたDSP(ディジタルシグナルプロセッサユニット)411と、DSP411に接続されたプログラムROM412と、DMAC406及びDSP411に接続されたマルチポートRAM415とを含んでいる。レジスタユニット409、RAM410及びマルチポートRAM415は、いずれも文字認識装置12のバスに接続されている。
(二)動作方法について
イ号製品のハードウェア及びソフトウェアによる動作方法は、(1)及び(2)において述べる原文入力から翻訳処理に至る操作及び処理手順であって、このうちとくに重要な処理手順については、(3)文字認識処理、(4)登録処理、(5)日本文呼出処理、(6)英文呼出処理、(7)翻訳処理としてさらに詳細に説明する。
(1)原文入力の操作及び処理手順
1 原文入力の操作及び処理手順の概略をイ号図面4の上段に示す。
まずオペレータが、イメージスキャナ12の原稿台に、句読点などを含んだ文書の原稿をセットする(510)。オペレータが、本体10の液晶表示画面に表示されたメニューから原稿読み取りを選択し動作を指示すると(512)、イメージスキャナ12が原稿を光学的に読み取り、読み取ったディジタルデータを文字認識装置14及び本体10に送る。本体10は液晶ディスプレイ上にそのイメージを表示する(514)。
2 続いてオペレータが、本体10の液晶ディスプレイ上に表示された原稿イメージ上でマウス18を用いて認識すべき領域を指定し(516)、液晶ディスプレイ上のメニューから認識実行を指示すると(518)、文字認識装置14が読み取られたイメージから文字認識処理を行い(520)、認識結果を本体10に送る。本体10は、この認識結果の文書データの文字をCGROMを用いてビットマップデータに展開して液晶ディスプレイ上に表示する(522)。このときの表示は、もとの原稿の文字配列を再現するフォーマットで行われる。そのために、文字認識装置の出力する文字データにおいて、原稿の各行の末尾(横書きの場合には右端)の文字の後ろには行の終わりを示すコードが挿入されている。
3 オペレータは、本体10の液晶ディスプレイに表示された認識結果を確認し、必要があれば本体のキーボード及びマウスを用いて認識結果を修正する(524)。修正する必要がなくなれば、オペレータは液晶ディスプレイ上のメニューから、マウスを用いて原文ファイル登録処理を指定して実行させる(526)。これに応答して、本体10は認識結果の原文をハードディスクユニットに原文ファイルとして登録する。登録処理については(4)で後述する。
以上で、原文の入力処理は終了である。
(2)翻訳処理の操作及び処理手順
1 翻訳処理を行う場合には、以下のような操作が行われる。
まず、翻訳するための原文を呼び出す処理がおこなわれる。これは、オペレータが、本体10の液晶ディスプレイ上のメニューから原文呼出処理を選択して実行を指示する(530)ことで開始される。この指示に応答して本体10が原文呼出処理を実行する(532)。日英翻訳の場合には日本文呼出処理が実行され、英日翻訳の場合には英文呼出処理が実行される。原文呼出処理の詳細は(5)(6)で後述する。なお、この翻訳の際の原文としては、(一)で述べたイメージスキャナ12及び文字認識装置14で読みとられハードディスクユニットに原文ファイルとして登録された原稿だけでなく、ワードプロセッサで作成された文書も対象となる。そのような文書はたとえばフロッピーディスクから呼び出される。
2 このようにして呼び出された原文に対しては、必要であればまず原文編集処理が行われる(534)。この処理は、翻訳に先立って、好ましい翻訳結果が得られるように原文を前編集する処理であり、オペレータが、本体10の液晶ディスプレイに表示された原文を、通常のワードプロセッサにおける編集と同様の手順で行う。この場合、前編集として特殊な記号の挿入を行ったり、(5)(6)で後述する原文呼出処理によって翻訳原文バッファにセットされた原文の翻訳単位を変更したりなどすることもある。
3 必要な前編集が終了し、翻訳を実行しようとする場合には、オペレータは本体10の液晶ディスプレイ上のメニューから翻訳処理を選択し、その実行を指示する(536)。この操作に応答して本体10が翻訳処理のプログラムを実行する(538)。この翻訳処理がイ号製品の中心的機能であり、その詳細は(7)で後述する。翻訳を終了後、本体10は翻訳結果を液晶ディスプレイ上に表示する(540)。オペレータはこの翻訳結果を確認し、必要であれば翻訳結果を修正する(542)。この処理を後編集と呼ぶ。
4 後編集まで終了し、最終的な翻訳結果が得られたときに、オペレータはメニューから翻訳結果の登録処理を選択し、その実行を本体10に対して指示する(544)。本体10は、この指示に応答して、翻訳結果をハードディスク等にファイルとして登録する(546)。
(3)文字認識処理
1 イ号図面5に、イ号図面4において参照符号520で示した文字認識処理の概略の流れを示す。この処理は、前述の通りイメージスキャナ12によって光学的に読みとられ、ビットイメージに変換された原稿に対して文字認識装置14が実行する処理である。
2 まず、原稿のイメージから、黒画素のかたまり領域(以下、この黒画素のかたまりを矩形とよぶ)を抽出する(552)。この矩形は、文字が「a」であれば「a」全体で一つの領域として、「i」であれば上部の点の部分と下部の縦棒の部分とが分離された二つの領域として、それぞれ抽出される。接触文字(隣接した文字、たとえばfとiとが接触したもの)の場合は、接触文字全体で一つの領域として抽出される。次に、左右の矩形間の接続関係を調べ、同一行となる矩形を連結することにより行を抽出する(554)。このように抽出された各行について、その基本ラインを抽出する(556)。さらに、英語の場合には各行内での単語領域抽出を行ない、日本語の場合には句読点、記号、符号なども含めた一文字単位と思われる領域を抽出する(558)。このようにして抽出された一単語(英語の場合)または一文字(日本語の場合)と思われる領域を、予め準備されている単語または文字の特徴データと比較(類似度計算)することで、文字・記号・符号認識処理が行われる(560)。なお、イ号製品では、この文字・記号・符号認識処理は、右のとおり類似度法を用いて行われている。
3 右の文字・記号・符号認識処理の際、得られる文字データによって元の原稿の文字列の配置が画面に再現されるようにするために、得られる文字データのうち、原稿の各行の末尾の文字の後ろにはすべて行の終わりを示すコードが挿入される。もしこのように行の終わりを示すコードを挿入しないと、画面上には各行が連なり全体が長大な一つの行として表示されてしまい、もとの原稿の文字列の配置を再現することができない。
(4)登録処理
1 イ号図面4の参照符号528で示す登録処理を実現するプログラムの処理手順をイ号図面6ないし10に示す。なお、この処理は、オペレータが液晶ディスプレイから登録処理を選択しその実行を本体10に対して指示することにより、本体10内で実行される。
右の指示により、イ号図面6に示すように、まず登録すべき文書が日本語か否かについての判断が行われる(570)。登録すべき文書が日本語文書の場合には日本語登録処理が行われ(572)、英語文書の場合には英語登録処理が行われる(574)。これら処理が終了すれば登録処理も終了である。
2 日本語登録処理についてイ号図面7を参照して説明する。この処理に先だって、光学的に読みとられ、文字・記号・符号認識処理によって文字コードに変換された文書は、本体内のRAMに記憶されている。
登録実行の指示により、まず登録先となる原文ファイルがオープンされる(590)。このオープンが正しく行われなかったときは、本体10の液晶表示ディスプレイ上にエラーメッセージを表示して(610)処理を終了する。原文ファイルを正常にオープンできたときには、次に述べる処理を、認識ライン数を記憶したカウンタの内容がゼロになるまで繰返す。認識ライン数を記憶したカウンタの数字は、文字認識が行なわれたときに、文字認識装置によって認識されたライン数に設定されており、一ライン処理されるごとに、一だけ減算される。したがって、カウンタの数字は、句読点、符号、記号等も含めた認識結果のうち、原文ファイルとして登録が済んでいないライン数を示す。そこでまず、認識ライン数を記憶したカウンタをチェックする(594)。このカウンタが0であれば登録すべき文書の終わりに達したということであるから、原文ファイルをクローズして(612)日本語登録処理を終了する。
カウンタが0でないときには、認識結果の文書の行内容をチェックし(598)、その行内に、文字・記号・符号認識処理により認識された文字であって、予め定められた改行コード挿入箇所があるか否かを判断する(600)。この場合の改行コード挿入箇所とは、全角のピリオド「.」または句点「。」の後ろである。改行コード挿入箇所があるときには、その箇所に改行コードを挿入し(602)、現在の行を原文ファイルに書き込む(604)。また、行内に改行コード挿入箇所がないときには、その行には何も変更が行われずそのまま原文ファイルに書き込まれる(604)。本システムでは、原文ファイルは、NOW/WORDと呼ばれるシャープ株式会社製のOAプロセッサ向けに作成されたワードプロセッサ用の形式で保持されるので、この書込の時にそのために必要な変換が行われる。
続いて、604の書込時に何らかのエラーが発生したか否かを判断し(606)、エラーが発生した場合にはエラーメッセージを表示して(610)処理を終了する。エラーが発生しなかったときには、認識ライン数カウンタを1減算して(608)再びステップ594に制御を戻す。以下、処理596での判断でカウンタの内容が0となるまで、以上のような処理が繰り返して行われる。
3 イ号図面8ないし10を参照して英語登録処理について説明する。
イ号図面8に示すように、まずバッファに格納されている認識結果の文書データを、一旦別の記憶領域Docに読出し(620)、その読み出された内容をハードディスク上の中間ファイルに書き込む(622)。この中間ファイルに対して文構造解析処理を実行する(624)。文構造解析処理の詳細についてはイ号図面9及び10を参照して次項で述べる。文構造解析処理の終了後には、改行コード挿入位置と判断された位置に改行コードが付加された文書データが中間ファイルに作成されている。この中間ファイルの内容をバッファDocに読出(626)した後中間ファイルを削除して(628)、バッファDocの内容をハードディスク上の原文ファイルに書き込む(630)。
4 イ号図面9を参照して、英語登録処理内での文構造解析処理の手順の詳細を説明する。なお、原文が英文の場合には、行の終わりを示すコードは改行コードとして取り扱われ、この文構造解析処理と類似の処理を行なう手順が、イ号図面13の英文呼出処理においても行われる。
この処理ではまず、タイトル行を分離するための準備処理をし、その後一文ずつ改行コードによって区分していく。イ号図面9に示すように、まず、中間ファイルから一行ずつ順次読出す(640)。この場合の一行とは、改行コードにより区分された文字列をいう。こうして、全ての行の文字数の和を計算し、その和を改行コードの数で割ることによって、原稿の一行あたりの平均の文字数を求める。続いて、このようにして求めた平均文字数の1/2を、後に述べるようにタイトル行の取りうる最大文字数(MAXタイトル)として設定する(642)。これは、次に述べるように、タイトル行など、その最後に句読点がない行であっても正しくその末尾に改行コードを加えることを可能にするためである。普通、タイトル行等は、本文内の行よりもかなり文字数が少ない。したがって、上述のようにタイトルと本文とを含めた全行の平均文字数の1/2に満たない数の文字しか含まない行をタイトルと判断すれば、タイトルを本文と正しく分離することが期待できるからである。もしこうした処理をしなければ、タイトルと本文とが区別無く続けて登録されてしまう。
続いて、原文バッファに、中間ファイルの内容を読み込み(644)、原文バッファのバッファ先頭ポインタをゼロにセットする(646)。また、中間ファイルのポインタを先頭に戻す(648)。これらはいずれも、処理650の文構造解析サブルーチンのための準備である。
文構造解析サブルーチンの内容については次項で述べるが、端的にいえば原文バッファ内の文書データ内の文章について、改行コード挿入条件を判断し、改行コード挿入位置と判断された位置に改行コードを挿入し、そのようにして得られた翻訳単位に相当する文字列データを一文バッファと呼ばれるバッファに格納する処理のことをいう。
続いて一文バッファの内容を、中間ファイルの、ポインタにより指し示される位置に書き込む(652)。その後、原文バッファの最後に到達したか否かを判断し(654)、最後に到達した場合にはファイルクローズ等の必要な処理を行って文構造解析処理を終了する。原文バッファの終わりに到達していない場合には、原文バッファのバッファ先頭ポインタに、文構造解析サブルーチンからの戻り値をセットし(656)、制御を文構造解析サブルーチンを実行する処理(650)に戻す。
以上が英語登録処理内での文構造解析処理の概略である。
5 イ号図面10を参照して、文構造解析サブルーチンの詳細について説明する。まず、一文バッファをクリアする(670)。原文バッファ先頭ポインタが示す原文バッファの番地から一文字を取り出し(672)、原文バッファの最後に到達したか否かを判断する(674)。原文バッファの最後に到達した場合には、バッファが終了したことを示すフラグをセットし、一文バッファの末尾に改行コードとNULL(「00」)とを付加して制御を呼出元に戻す(676)。
原文バッファの最後に到達していないと判断されたときは(674)、ステップ672で原文バッファから取り出された文字が文頭のスペース文字か否かを判定する(678)。文頭のスペース文字である場合には、原文バッファ先頭ポインタを1進めて(692)制御をステップ672に戻す。取り出された文字が文頭のスペース文字でないときは、取り出された文字を一文バッファの末尾に加える(680)。
続いて、このように一文バッファの末尾に加えられた文字が改行コードか否かを判定し(682)、改行コードであればその一文字前も改行か否かを判定する(684)。一文字前も改行コードであるときには、認識結果において、現在の一文バッファの内容に相当する行の後ろに一行空行があるということであるから、この空行を削除する。すなわち、ステップ680で一文バッファの末尾に加えた改行コードを取り除く(716)。またこのように空行がある場合、その前の行が段落の終わりまたはタイトル行であることが多い。そこで制御をステップ688に進め、ステップ688では一文バッファの末尾にNULLを加え、原文バッファのポインタを更新して制御を呼出元に戻す。
一方、ステップ684で、一文字前が改行コードではないと判定された場合には、一文バッファの中の文字列の長さが、先に求められたMAXタイトル以下か否かを判定する(686)。MAXタイトル以下の場合には、この行がタイトル行である可能性が高い。そこでこの場合にも制御は前述のステップ688に進む。
ステップ686で一文バッファ内の文字列の長さがMAXタイトル以下ではないと判定されたときは、一文バッファの内容が本文の一行分の文字列に相当すると考えられるので、改行コードの挿入条件は満足されず、その最後に改行コードを挿入しておくのは適切でない。そこで、ステップ680で一文バッファの末尾に加えられた改行コードをスペースに換え(690)、さらに原文バッファ先頭ポインタを1進めて(692)、ステップ672に制御を戻す。こうして、認識結果において、原稿の各行の末尾に挿入されていた改行コードは順にスペースに変換されていくが、原稿の各行のうち、MAXタイトル以下の文字数しか含まない行、及び後ろに空行が存在する行については、独立したタイトル行または段落の終わりと判断されてその末尾の改行コードは残される。
一方、原文バッファから取り出され一文バッファの末尾に加えられた文字が改行コードではないとステップ682で判断された場合には、以下のように種々の条件を勘案して、認識結果の本文を一つ一つの文に分離していく処理が実行される。まずその文字が文末文字であるか否かについての判定が行われる(694)。この場合の「文末文字」とは、本来は文の区切りを示す文字であるが、特定の場合には文の区切りではなく文中に使われる文字のことをいう。たとえば「Mr.」という省略文字列におけるピリオドなどがこれに相当する。この文字が文末文字でないと判定された場合には、ステップ696でその文字が文中文字であるか否かについての判定が行われる。文中文字とは「;」「:」等をいう。これら文中文字は、その後ろにスペースが続く場合には文末を表す。そこでその次の文字がスペースか否かが判定され(698)、スペースであれば、一文バッファの末尾に改行コードとNULLとを加え、原文バッファのポインタを更新して(714)このサブルーチンを終了する。ステップ696で当該文字が文中文字でないと判定された場合、及びステップ698で当該文字の次の文字がスペースでないと判定された場合には、原文バッファ先頭ポインタを1進めて(692)ステップ672の処理に移る。
一方ステップ694でこの文字が文末文字であると判定された場合には、ステップ700で、その文末文字の前が、省略文字列であるか否かが判定される。省略文字列であればこの文末文字は改行コード挿入条件を満足していないので制御はステップ692に進み、原文バッファ先頭ポインタを1進めてさらにステップ672以下の、次の文字に対する処理を行う。
ステップ700で、当該文字の前の文字列が省略文字列でないと判定された場合には、当該文字の後ろがスペースか否かについての判定が行われる(702)。スペースの場合にはさらにスペースが続くか否かについての判定が行われる(702)。スペースが続く場合には、英文ではこの文末文字(ピリオド)は改行コード挿入条件を満足していると考えられるので、一文バッファの末尾に改行コードとNULLとを加えて、原文バッファのポインタを更新して(714)このサブルーチンを終了する。ステップ704で、当該文字の後ろのスペースにさらにスペースは続かないと判定された場合は、スペースの次の文字が小文字か否かについての判定が行われる(706)。小文字であれば、そこは改行コード挿入条件を満足していないと考えられるので、改行コードの挿入等は行わず、原文バッファ先頭ポインタを1進めて(692)制御をステップ672に戻す。スペースの次が小文字ではないときには、文末文字(ピリオド)の前が大文字一文字か否かについての判定が行われる(712)。大文字一文字ではない場合、一文バッファの末尾に改行コードとNULLとを加え、原文バッファのポインタを更新して(714)このサブルーチンを終了する。大文字一文字である場合は、例えば人名のミドルネームの省略形(John F. Kennedyの「F.」)などに相当すると考えられるので、単に原文バッファ先頭ポインタを1進めて(692)ステップ672に制御を戻す。
ステップ702で、当該文字の後ろがスペースではないと判定された場合、当該文字の後ろが閉じ括弧類の文字か否かが判定される(708)。後ろが閉じ括弧類でない場合、単に原文バッファ先頭ポインタを1進めて(692)ステップ672に制御を戻す。後ろが閉じ括弧類である場合には、その閉じ括弧類の次がスペースか否かが判定される(710)。スペースでないときには、単に原文バッファ先頭ポインタを1進めて(692)ステップ672に制御を戻す。スペースであるときには、一文バッファの末尾に改行コードとNULLとを加え、原文バッファのポインタを更新して(714)このサブルーチンを終了する。
以上が文構造解析サブルーチンの内容である。
(5)日本文呼出処理
1 イ号図面4のステップ532で行われる処理のうち、日英翻訳システムで行われる日本文呼出処理についてイ号図面11及び12を参照して説明する。
この処理は、オペレータが液晶ディスプレイ上の表示から「翻訳原文呼出」の実行を本体10に対して指示することで起動される。実行指示により、まず、オペレータの指定した文書ファイルが開かれる(730)。この文書ファイルは、既に述べたようにイメージスキャナ装置及び文字認識装置によって原稿から読みとられた文書であってもよいし、他のワードプロセッサ等によって作成された文書であってもよい。続いて、文書を開く処理においてエラーがあったかどうかを判定する(732)。エラーとは、例えば指定された文書が存在しなかったり、文書の形式が正しくなかったりした場合である。エラーがあった場合には、対応のエラーメッセージ表示等を行った上で日本文呼出処理を終了する。
ファイルをエラーなく開くことができた場合には、処理に必要なバッファ(原文バッファ、訳文バッファ、及び中間的な処理に必要とされるバッファ)をRAMに確保する(734)。続いて、一文の呼出処理サブルーチンをコールする(736)。一文の呼出処理については次項で後述するが、原文ファイル中の文書を一文単位で呼び出して所定のバッファに格納するための処理である。続いて、最後の文まで処理が終了したか否かが判定され(738)、最後の文まで処理が終了していない場合には、呼び出された文字数が、バッファサイズにより定まる最大文字数を超えたか否かを判定する(740)。最大文字数を超えていない場合には、呼び出された一文をバックアップファイルに書き出して(742)、再びステップ736に制御を戻して次の文の処理を行う。
ステップ738で最後の文まで到達したと判定された場合、及びステップ740で最大文字数を超えたと判定された場合には、バックアップファイルから文を読み出して、原文バッファと訳文バッファとにセットして処理を終了する(744)。
2 ステップ736で行われる一文の呼出処理サブルーチンの内容をイ号図面12に示す。
この処理は、原文ファイルから、一文ずつ、または一文が長い場合にはバッファサイズ分ずつだけ、原文バッファにコピーしていく処理である。まず、バッファbufに、後に述べるようなコピーがされていないデータがあるか否かを判定する(760)。このバッファbufには、原文ファイルから呼び出された原文のうちの一文に相当するデータが格納され、その中から一度に翻訳可能な最大文字数ずつ他のバッファgenにコピーされるとともに、バッファbufの先頭ポインタが、コピーされた文字列の次の文字に設定される。したがって、バッファbufにコピーのされていないデータが存在する場合には、その残りのデータについて引き続きバッファgenにコピーすることが必要なので、以下に述べるステップ762、764及び766の処理は行わず、直接処理770に制御が移る。
バッファbufにコピーの済んでいないデータが存在しない場合、バッファinbufにコピーの済んでいないデータが存在するか否かの判定を行う(762)。このバッファinbufは、原文ファイルから読み出された原文データが一旦格納される記憶領域である。バッファinbufにコピーの済んでいないデータが残っていない場合には、原文ファイルからデータを読み込んでバッファinbufに格納する(764)が、バッファinbufにコピーの済んでいないデータが残っている場合にはこの原文ファイルからの読み込みは行われない。
続いて、次に述べる一文呼出し条件のもとにバッファinbufを検索しながら、所定の一文呼出し条件を満足する文字までをバッファinbufの先頭からバッファoutbufにコピーする(766)。このとき、バッファinbufの先頭ポインタを、当該文字の次にセットする。
一文呼出し条件は(二)の(2)の1で述べた通り文字認識装置14で読みとられた原稿だけでなくワードプロセッサで作成された文書も対象となる為、種々の条件を考慮して定められており、その概略は次の通りである。
一 文頭のタブ、スペースは削除する。
二 「文区切り文字」は、「一文呼出し条件を満足する文字」とするが、「文区切り文字」が連続する場合は、最後の「文区切り文字」を「一文呼出し条件を満足する文字」とする。
三 コントロール文字は削除する。
四 文中のタブ、改行は「一文呼出し条件を満足する文字」とする。
五 「文区切り文字」であっても、その後ろに閉じ括弧類(”、)、]、〕、>、」)があったときは「一文呼出し条件を満足する文字」としない。
なお、「文区切り文字」は、オペレーターが一文の切れ目として設定する。
続いて、ステップ768で、バッファbufにコピーされた文字数(ステップ766から制御が進んだ場合)またはバッファbufに残っている文字数(ステップ760から制御が進んだ場合)が、最大文字数を超えているか否かについての判定をする(770)。最大文字数を超えていない場合にはバッファbufの内容をすべてバッファgenにコピーし、バッファbufをクリアして(772)サブルーチンを終了する。一方バッファbufの文字数が最大文字数を超えている場合には、バッファbuf内のデータのうち、バッファgenのサイズ分だけをバッファgenにコピーし、バッファbufのポインタをコピーされた最後の文字の次にセットして(774)サブルーチンを終了する。このようにして、一文の呼出処理サブルーチンによって、原文ファイル中の、一文呼出し条件を満足する文字により区分されるべき一文がバッファgenにコピーされることになる。そしてバッファgenにコピーされた一文を、文番号で区分された翻訳原文バッファにセットする。
その後、翻訳原文、バッファにセットされた全ての文は、文番号毎にVRAM104に展開され、液晶ディスプレイ上に表示される。
(6)英文呼出処理
イ号図面4の処理532で行われる処理のうち、英日翻訳システムで行われる英文呼出処理をイ号図面13に示す。この英文呼出処理は、イ号図面10を参照して説明したイ号図面9に示されたステップ654の処理に、ステップ790が追加されている点を除いて、イ号図面9とほぼ同一である。したがって、ここではステップ790を除いて英文呼出処理の詳細な説明は繰り返さない。
ステップ790は、ステップ654で原文バッファの最後まで到達したと判定されたときに行なわれる。ステップ790では、ステップ650からステップ656までの繰返し処理の結果中間ファイルに格納されている、改行コード挿入位置に改行コードが挿入されている原文を、改行コードごとに読み出して文番号で区分された翻訳原文バッファにセットする。
その後、翻訳原文バッファにセットされた全ての文は、文番号毎にVRAM104に展開され、液晶ディスプレイ上に表示される。
(7)翻訳処理
イ号図面4のステップ538で行われる翻訳処理についてイ号図面14を参照して説明する。
この処理は、イ号図面4のステップ536にも示すように、オペレータが液晶ディスプレイ上のメニューから「翻訳指示」を選択し実行を指示することにより本体10内に起動される。実行指示により、まず文番号を1にセットする(830)。この文番号に対応する原文バッファに原文が存在するか否かを判定し(832)、存在する場合にはその一文に対して一文翻訳処理を実行する(834)。翻訳結果を訳文バッファにセットして(836)、訳文を液晶ディスプレイ上に表示する(838)。そして、文番号に1を加算して(840)再びステップ832以下の処理を行う。そしてステップ832で、文番号に対応する原文バッファに原文が存在しないと判定されたときに、翻訳処理が終了される。
なお、以上の説明は、一括翻訳モードについてのものである。逐次翻訳モードでは、文番号をオペレータが指定すること、及び次の文の翻訳の実行をオペレータが指示することを除いて右に述べた一括翻訳モードと同様である。
以上
図面目録
イ号図面 1 システムの外観及び構成を示すシステム構造図
イ号図面 2 本体及びプリンタ装置の回路ブロック図
イ号図面 3 文字認識装置及びイメージスキャナ装置の回路ブロック図
イ号図面 4 本装置を用いた原文入力及び翻訳の操作及び手順を示すフロー図
イ号図面 5 原文入力において文字認識装置の行う光学的文字読取(OCR)動作の全体フロー図
イ号図面 6 文字認識装置による認識後の原文の原文ファイルへの登録処理のフロー図
イ号図面 7 日英翻訳システムの登録処理において行われる日本語登録処理のフロー図
イ号図面 8 英日翻訳システムの登録処理において行われる英語登録処理のフロー図
イ号図面 9 英語登録処理中の英文の文構造解析処理のフロー図
イ号図面10 英文の文構造解析処理中の文構造解析サブルーチンのフロー図
イ号図面11 日英翻訳システムでの翻訳原文である日本文の呼出処理サブルーチンのメインフロー図
イ号図面12 日本文の呼出処理における一文の呼出処理のフロー図
イ号図面13 英文呼出処理のフロー図
イ号図面14 翻訳処理のフロー図
符号目録
10 翻訳装置本体
12 イメージスキャナ
14 文字認識装置
16 プリンタ装置
18 マウス
20 ACアダプタ
22 SCSI接続ケーブル
24 プリンタ接続ケーブル
101 中央処理制御装置(CPU)
102 ディスプレイ及びメモリコントローラ
103 ランダムアクセスメモリ(DRAM)
104 ビデオRAM(VRAM)
105 I/Oコントローラ
106 基準クロック発生ユニット
107 ダイレクト・メモリ・アクセス・コントローラ(DMAC)
108 SCSIC(入出力インターフェイス)
109 フロッピーディスクコントローラユニット
110 シリアルインターフェイスユニット
111 起動プログラムROM(IPLROM)
112 辞書ROM
113 文字フォント(CG)ROM
114 ハードディスクユニット
115 フロッピーディスクドライブユニット
116 液晶ディスプレイユニット
117 電源回路ユニット
118 キーボードユニット
119 テンキーユニット
120 アドレスバス
121 データバス
201 CPU
202 プログラム・文字フォントROM
203 RAM
204 コントローラ
205 メカドライバーユニット
206 インターフェイス
207 キャリッジモータ及びペーパーフィードモータ
208 記録ヘッドユニット
209 電源回路ユニット
210 バス
301 CPU
302 プログラムROM
303 RAM
304 イメージデータプロセッサユニット
305 周辺制御プロセッサユニット
306 アナログ/デジタル(A/D)コンバータユニット
307 RAM
308 CCD(電荷結合素子)ユニット
309 センサー・スイッチ・モータドライバーユニット
310 RAM
311 CCDユニット搬送モータ
312 スイッチセンサー
313 インターフェイスユニット
314 電源回路ユニット
315 バス
350 接続ケーブル
401 メインCPU
402 プログラムROM
403 パラレルI/F
404 RAM
405 SCSIコントローラ
406 ダイレクト・メモリ・アクセス・コントローラ(DMAC)
407 サブCPU
408 プログラムROM
409 レジスタユニット
410 RAM
411 デジタルシグナルプロセッサユニット
412 プログラムROM
413 レジスタユニット
414 RAM
415 マルチポートRAM
416 電源回路ユニット
SUB1ないし4 分散処理ユニット
以上
イ号図面1
<省略>
イ号図面2
<省略>
イ号図面3
<省略>
イ号図面4 操作及び処理手順
<省略>
イ号図面5 1.OCR
<省略>
イ号図面6 2-1.登録処理
<省略>
イ号図面7 2-2日本語登録処理
<省略>
イ号図面8 2-3.英語登録処理
<省略>
イ号図面9 2-3.1文構造解析(英文)
<省略>
イ号図面10 文構造解析サブ
<省略>
イ号図面11 3-1.1 日本文呼出し処理
<省略>
イ号図面12 3-1.2 日本文一文呼出し処理サブ
<省略>
イ号図面13 3-2英文呼出し処理
<省略>
イ号図面14 4翻訳処理
<省略>
(別紙)イ号物件構成対応目録(原告)
a 文字・句読点・記号・符号を含んだ一連の複数の文(文書)から、文字・句読点・記号・符号等の形態を光学的に画像信号(画像情報)として読み取るイメージスキャナ12
b イメージスキャナ12により読み取られた文字・句読点・記号・符号等の形態(画像信号)を、あらかじめ記憶している単語(英語の場合)又は文字(日本語の場合)の特徴データと比較(類似度計算)することで、文字・句読点・記号・符号を認識し、文字信号(文字情報)に変換する文字認識装置14
c (主位的構成)
コンピュータプログラム動作により、文字認識装置14で文字認識された一連の文書(文字信号)中の「改行コード挿入条件を満足する文字」の後ろの位置に、改行コードを挿入(即ち、一文ずつに分割)する機能
(予備的構成)
日本文呼出し処理において、コンピユータプログラム動作により、文字認識装置14で文字認識された一連の文書(文字信号)を、一文ずつに区分して呼び出す機能
d (主位的特定)
コンピュータプログラム動作により、文字認識装置14から出力される文字認識された文書(文字信号)中に存在する「改行コード挿入条件を満足する文字」を検出した際、該文字の後ろに改行コードを挿入することを指示する機能
(予備的特定)
日本文呼出し処理において、コンピュータプログラム動作により、文字認識装置14から出力される文字認識された文書(文字信号)中に存在する「一文呼出し条件を満足する文字」を検出した際、一文ずつに区分して呼び出すことを指示する機能
e を備えてなる機械翻訳システム
(別紙)イ号物件構成対応目録(被告)
一 翻訳装置として構成した場合
a 文字、句読点、記号、符号等により構成された複数の文章を含む文書から、文字、句読点、記号、符号等の形態を光学的に読み取るイメージスキャナーと
b イメージスキャナーにより読み取られた文章について、読み取られた文字、句読点、記号、符号等の形態から文字、句読点、記号、符号等を文字認識して文字コードデータに変換し、得られた文字コードデータのうち、原稿の各行の最後の文字の後ろに相当する位置に行の終わりを示すコードを挿入する処理を行い、その結果をディスプレイに表示する文字認識装置と
c 文字認識装置により文字認識された文書の文字コードデータを本体内のRAMに記憶し、オペレーターが登録処理を選択し、その実行を本体に指示することにより、コンピユータとコンピユータプログラムを用いて、当該文書が、
(1) 日本語であれば、オペレーターの登録処理指示により文字認識された各行の文字コードデータの内容を判断し、あらかじめ定められた改行コード挿入箇所があれば、その後ろに改行コードを挿入し、これを原文ファイルに登録し(日本語登録処理)、次いで、オペレーターが指定した日本語の原文ファイルを開き、その中で一定の一文呼出し条件の下に一文呼出し条件を満足する文字の文字コードデータまでをバッファgenにコピーし、このコピーされた一文を文番号で区分された翻訳原文バッファにセットし(日本語呼出し処理)、このようにしてセットされた翻訳原文の文字コードデータに対して、オペレーターの翻訳指示により、これを翻訳する手段と
(2) 英語であれば、オペレーターの登録処理指示により認識された文字コードデータについて、文構造解析処理を行い、種々の条件を判断して、文字認識結果の文字コードデータ文章を一文ずつに分離していく処理を行い、各文の末尾に改行コードを付して、当該文字コードデータを一文ずつ原文ファイルに登録し(英語登録処理)、次いで、オペレーターが指定した英語の原文ファイルを開き、各文の末尾に改行コードが挿入されている原文の文字コードデータを改行コードごとに呼び出して翻訳原文バッファにセットし(英文呼出し処理)、このようにしてセットされた翻訳原文の文字コードデータに対して、オペレーターの翻訳指示により、これを翻訳する手段と
d 前記Cの(1)又は(2)により翻訳原文バッファにセットされた翻訳原文の文字コードデータに対して、オペレーターの翻訳指示により、翻訳処理を実行させる手段と
e を備えてなる翻訳装置
二 「改行コード挿入」「一文ずつに区分して呼び出す」装置として構成する場合
1 「改行コード挿入」装置として構成する場合
a 文字、句読点、記号、符号等により構成された複数の文章を含む文書から、文字、句読点、記号、符号等の形態を光学的に読み取るイメージスキャナーと
b イメージスキャナーにより読み取られた文章について、読み取られた文字、句読点、記号、符号等の形態から文字、句読点、記号、符号等を文字認識して文字コードデータに変換し、得られた文字コードデータのうち、原稿の各行の最後の文字コードの後ろに相当する位置に行の終わりを示すコードを挿入する処理を行い、その結果をディスプレイに表示する文字認識装置と
c 文字認識装置により文字認識された文書の文字コードデータを本体内のRAMに記憶し、オペレーターが登録処理を選択し、その実行を本体に指示することにより、コンピュータとコンピュータプログラムを用いて、登録処理すべき文書が
(1) 日本語であれば、オペレーターによる登録処理の実行指示により、本体内のRAMに記憶された文字認識結果の各行の文字コードデータをチェックし、あらかじめ定められた改行コード挿入箇所があるか否かを判断し、改行コード挿入箇所があるときには、その箇所に改行コードを挿入する手段と
(2) 英語であれば、オペレーターの登録処理の実行指示により、認識結果の文字コードデータをいつたん記憶領域Docに呼び出し、その呼び出された内容をハードデイスク上の中間ファイルに書き込み、この中間ファイルから呼び出された文字コードデータについて、各行の文字数を計算してタイトル行を分離する処理を行い、その上でタイトル行以外の部分について文構造解析処理を行い、種々の条件を判断して、文字認識結果の文字コードデータの文章を一文ずつに分離していく処理を行い、各文の末尾に改行コードとNULLを加える手段と
d 登録処理すべき原文が
(1) 日本語であれば、オペレーターによる登録処理の実行指示により、本体内のRAMに記憶された文字認識結果の各行の文字コードデータをチェックし、あらかじめ定められた改行コード挿入箇所があるか否かを判断し、改行コード挿入箇所があるときには、その箇所に改行コードを挿入する処理を実行するよう指示する手段と
(2) 英語であれば、オペレーターの登録処理の実行指示により、文字認識結果の文字コードデータをいつたん記憶領域Docに呼び出し、その呼び出された内容をハードデイスク上の中間ファイルに書き込み、この中間ファイルから呼び出された文字コードデータについて、各行の文字数を計算してタイトル行を分離する処理を行い、その上でタイトル行以外の部分について文構造解析処理を行い、種々の条件を判断して、認識結果の文章を一文ずつに分離していく処理を行い、各文の末尾に改行コードとNULLを加える処理を実行するよう指示する手段と
e を備えてなる改行コード挿入装置
2 「一文ずつに区分して呼び出す」装置として構成する場合
a 文字、句読点、記号、符号等により構成された複数の文章を含む文書から、句読点、記号、符号等の形態を光学的に読み取るイメージスキャナーと
b イメージスキャナーにより読み取られた文章について、読み取られた文字、句読点、記号、符号等の形態から文字、句読点、記号、符号等を文字認識して文字コードデータに変換し、得られた文字コードデータのうち、原稿の各行の最後の文字の後ろに相当する位置に行の終わりを示すコードを挿入する処理を行い、その結果をディスプレイに表示する機能を有する文字認識装置と
c コンピュータとコンピユータプログラムを用いて文字認識装置により文字認識された文書について、
(1) 日本語であれば、オペレーターの実行指示により、文字認識された各行の文字コードデータの内容を判断し、あらかじめ定められた改行コード挿入箇所があれば、その後ろに改行コードを挿入し、これを原文ファイルに登録し、次いで、オペレーターが呼出し処理を指示した場合、日本語の原文ファイルを開き、その中で一定の一文呼出し条件の下に一文呼出し条件を満足する文字の文字コードデータまでをバッファgenにコピーし、このコピーされた一文を文番号で区分された翻訳原文バッファにセットする手段と
(2) 英語であれば、文字認識された文字コードデータについて、文構造解析処理を行い、種々の条件を判断して、認識結果の文章を一文ずつに分離していく処理を行い、それを一文ずつ原文ファイルに登録し、次いで、オペレーターが指定した英語の原文ファイルを開き、各文ごとに呼び出して翻訳原文バッファにセットする手段と
d オペレータが呼出し処理を指示した場合、
(1) 日本語であれば、オペレーターが指定した日本語の原文ファイルを開き、その中で一定の一文呼出し条件の下に一文呼び出し条件を満足する文字の文字コードデータまでをバッファgenにコピーし、このコピーされた一文を文番号で区分された翻訳原文バッファにセットすることを指示する手段と
(2) 英語であれば、オペレーターが指定した英語の原文ファイルを開き、フアイルされている原文を一文ずつ呼び出して翻訳原文バッファにセットすることを指示する手段と
e を備えてなる一文ずつ区分して呼び出す装置
<19>日本国特許庁(JP) <11>特許出願公告
<12>特許公報(B2) 平2-7107
<51>Int.Cl.3G 06 F 15/38 3/16 識別記号 V 320 H 庁内整理番号 7313-5B 7341-5B <24><44>公告 平成2年(1990)2月15日
発明の数 1
<54>発明の名称 情報処理装置
<21>特願昭63-6595 <65>公開昭63-238672
<22>出願昭55(1980)12月13日 <43>昭63(1988)10月4日
<52>特願昭55-176296の分割
<72>発明者 池上徳子 兵庫県尼崎市立花町2丁日17番27号
<71>出願人 池上健三 兵庫県尼崎市立花町2丁目12番25号
審査官 梅村勁樹
<56>参考文献 特開昭51-11541(JP、A) 特開昭52-144205(JP、A)
<57>特許請求の範囲
1 処理すべき未処理情報を入力する入力手段と、
前記入力手段に入力された情報を認識する認識手段と、
前記認識手段で認識された未処理情報に基づいて、それに対応する処理済情報に処理する情報処理手段と、
前記認識手段から出力される認識後の情報中に存在する終端情報を検出した際、前記情報処理手段に処理動作を実行させる処理実行指示手段とを備えてなる情報処理装置。
2 処理実行指示手段は、認識手段から出力される認識後の情報中に存在する所定時間以上の空白情報を検出した際、情報処理手段に処理動作を実行させることを特徴とする特許請求の範囲第1項に記載の情報処理装置。
3 入力手段は、遠くはなれた所から通信回線などを介して送られてくる処理すべき未処理情報を受信する受信手段であることを特徴とする特許請求の範囲第1項に記載の情報処理装置。
4 入力手段は、処理すべき音声情報を入力する音声入力手段であり、
認識手段は、前記音声入力手段に入力された音声情報を認識する音声認識手段であることを特徴とする特許請求の範囲第1項に記載の情報処理装置。
5 情報処理手段は、元言語情報を翻訳言語情報に翻訳する翻訳手段であることを特徴とする特許請求の範囲第1項ないし第4項のいずれかに記載の情報処理装置。
発明の群細な説明
本発明は、情報処理装置に関する。
なお、本明細書において、翻訳とは、(1)ある国の言語を他の国の言語に直すこと、(2)同一国内の言語であつても、例えば、略語を原文に直すこと、また、標準語と方言との相互変換などを行なうこと、(3)演算(計算全般および“兀”(バイ)と印加して“3.14……”の数値を得ること)などをいう。
元言語とは、翻訳前の言語、数値、式などをいい、翻訳言語とは、翻訳後の言語、数値、式などをいう。例えば、日本語と英語に翻訳するようにセツトした電子翻訳装置において、“おはよう”は元言語であり、“グツドモーニング”は翻訳言語である。
音響装置には、テレビ、ラジオ、電話、テーブレコーダなどが含まれ、受信装置には、テレビ、ラジオ、電話なども含まれる。
また、空白とは、情報信号中に存在する無信号状態、若しくは、無信号に近い状態、または、これらと実質的に同等な状態をいう。
次に、情報処理装置の一例として電子翻訳装置について詳説する。
第1図は、本発明者が、既に、特開昭56-103765号、同57-17081号、実開昭56-83857号公報などにて提案している電子翻訳装置(以下、TLRDという)のプロツク図である。
図中1は、DPマツチング式の音声認識手段(SR)に接続された音声入力用のマイクであり、3は、SR2から出力された日本語の文宇情報を英語の文字情報に翻訳する和英式の電子翻訳手段(TLR)であり、4は、TLR3からの英語の文字情報に基づいて、それに対応する英語の音声情報を順次合成し、スピーカ(SP)5に送出するバーコール方式の音声合成手段(SM)である。743、SR2からの文字情報を一時記憶しているメモリ(TLR3内にある)から、その情報を読み出し、TLR3に翻訳動作を手動で実行指示するための翻訳動作実行指示キー(TS)であり、6は、元言語(日本語)の文字表示と翻訳言語(英語)の文字表示とを液晶表示にて行なう文字表示手段(LCD)である。
次に、この装置の動作を説明する。
まず、マイク1に向って“アナタワダレデスカ”と言うと、この音声情報は、マイク1を介してSR2に入力され、ここで順次、音声認識され、“アナタワダレデスカ”なる文字情報に変換されてTLR3のメモリに記憶される。
ここで、TS7を手でONするとTLR3は、メモリから、この文字情報を読み出し、それに対応する“WHO ARE YOU?”なる英語の文字情報に文単位で翻訳し、SM4に出力する。SM4は、これに対応する“フーアーユー”なる英語の音声情報を順次合成し、SP5に出力する。
この間、LCD6は、日本語の文字情報および英語の文字情報を文字表示する。
しかしながら、このような装置では、音声で元言語情報を入力することが出来るにも拘らず、翻訳指示を手動でしなければならないため、手操作不要というせつかくの音声入力方式のメリツトを十分に発揮させることができず、また、手動で翻訳単位ごとに適切にタイミングよく翻訳指示をしなければならないので、テレビ、ラジオ、電話などの音響装置を入力手段として用いることができず、実用性に欠けるという欠点があつた。
本発明は、かかる欠点を除去するものであり、手操作不要の自動処理、自動翻訳を可能にした実用価値の大きい情報処理装置(電子翻訳装置もその1つである)を提供するものである。
以下、本発明の一実施例を第2図、第3図を用いて説明する。
第2図は、本発明の一実施例である電子翻訳装置(以下、TLRDともいう)のプロツク図、第3図は、同装置の各部出力のタイミングチヤートである。
図中1から6のものは、第1図に示すそれと同じものである.
7'は、手動/自動の両用が可能な翻訳動作実行指示手段(AS)、8は、SR2からの出力情報中に存在する所定時間以上の空白(無信号、無信号に近いもの、または、実質的に認識出力のない状態を含む)を検出した際、翻訳すべき元言語情報の終了とみなし、出力を送出し、AS7'を作動させる空白検出手段(VOX)である。
次に、この装置の動作を第3図を用いて説明する。
まず、マイク1に向つて“アナタワダレデスカ”と言うと、マイク1からは、第3図Aに示すような出力がSR2に印加される。
そして、SR2からは、第3図Bに示すような出力が、TLR3およびVOX8に送出される。
ここで、明らかなように、マイク1の出力には“アナタワダレデスカ”という翻訳すべき音声情報の他に、特にその前後には、人々の会話音、機器の操作音、ドアの開閉音などの周囲ノイズが混入しているが、このようなノイズは、SR2を通して出力されることはなく、カツトされるので、SR2の出力としてTLR3およびVOX8に印加されるのは、第3図Bに示すように、認識された結果としての文字情報だけである。
また、VOX8は、“アナタワ”と“ダレデスカ”との間に空白はあるが、この空白(約0.1~0.2秒)では、短かいため出力を送出せず、“ダレデスカ”の後に続くT秒間(本実施例では、VOX8を約1秒にセツトした)の空白を検出して初めてT秒後に出力をAS7'に送出する。
尚、本実施例では、SR2は、リアルタイムで音声認識を行なうものとして説明するが、実際の音声認識装置では、200~1000msec程度の遅れが生ヒる。
次に、これを受けてAS7'は、TLR3にそれまでに入力され、自身のメモリに書き込まれた“アナタワダレデスカ”なる日本語の文字情報を読み出し、それを一文として文単位で翻訳を実行させる。
TLR3は、これを“WHO ARE YOU?”なる英語の文字情報に翻訳し、SM4に送出する。SM4は、これに対応する英語の音声情報に順次合成し、“フーアーユー”なる合成音声をSP5に送出する。
このようにすることにより、マイク1に向つて御“アナタワダレデスカ”と言つた後、1秒間黙って(無音時間)おくだけで(通常会話では、自然に、この程度の無音時間が各文ごとに発生する)、自動的にTLR3を作動させることができ、何らの手操作も要しないので音声入力方式のメリツトを最大限に発揮させることができる。
また、第3図に示すように、マイク1に“ワタシワトムデス”なる音声を入力した場合も、上記同様の動作をくり返し、“トムデス”の後の1秒周の空白状態を検出後、VOX8は、出力を送出し、AS7'を介して、TLR3を作動させ、“I AM TOM.”なる翻訳言語の文字情報を出力させ、SM4を介してSP5に“アイ アム トム”なる音声情報を送出させることができるのである。
以下同様の動作をくり返す。
また、LCD6は、TLR3の入出力情報である“アナタワダレデスカ”、“WHO ARE YOU?”を共に文字表示するので視覚をもつてチェツクできる。
SR2の出力をVOX8の入力として用いているので、SR2の認識串力には、マイク1に入来する不要な周囲ノイズ(入力者の呼吸音なども入る)は現われないので、精度の高い無信号状態の検出が可能となり、タイミングよくAS7'、TLR3を作動させることができる。
次に、本発明の他の実施例を第4図を用いて説明する。
第4図は、本発明の他の実施例であるTLRDのプロツク図であり、図中2ないし8は、第2図に示すTLRDのものと同じものである。
第2図に示すTLRDとの違いは、マイク1の代りに、ラジオ送受信手段(RD)9に置き換えた点だけである。
まず、RD9のダイヤルを放送局にチューニングセツトすることによりラジオ放送を受信することができ、検波・再生後の日本語の音声情報をSR2に出力させる。SR2は、この受信放送の音声情報を音声認識し、文字情報に変換後、TLR3に送出し、英文に翻訳させる。
この際、RD9の受信出力には、空電、隣接周波数の他放送からの混信などがノイズとして混入しているわけであるが、SR2の出力には、このようなノイズは、出力されない。
したがつて、SR2の出力側に接続されたVOX8は、SR2の出力(認識された文字情報)だけに作動し、文字情報出力の有無およびその継続時間を判別するのである。もし、RD9の曲力をVOX8の入力にすると、RD9の出力のように常時不要なノイズが出力されているものについては、どの信号レベル以下をもって無信号とみなすかということか非常に重要な問題であり、かつ極めて難しい問題となる。
すなわち、無信号とみなすレベルを高く設定するとノイズに対しては強くなるが、入力音声情報の語尾などレベルの低い所が無信号とみなされ、入力途中であるのにVOX8が作動し、音声入力中、不本意たしかも不要時にひんばんにVOX8が出力を発し、AS7'のタイミングが合わないという問題が生じる。また、逆に、無信号とみなすレベルを低く設定すると、ノイズから完全に遮音された特別な室内で用いた場合はよいが、普通の室内・外ではノイズが多く、音声入力が終了してもまだノイズがあるため無信号とはみなさず、VOX8は全く出力を送出せず、自動処理ができないと言う問題が生じる。
しかしながら、本実施例では、VOX8をSR2の出力側に接続しているので、このような問題は全て解消できる。
尚、本実施例では、ラジオ受信機の例を示したがこれに限るものではなく、テレビ、電話などの音響装置であつても同様に実施できる。
次に、本発明の他の実施例を第5図を用いて、説明する。
第5図は、本発明の他の実施例であるTLRDのプロツク図であり、図中1ないし8は、第2図に示すTLRDのものと同じものである。
10は、キー入力型の文字情報発生手段(KEY)、11は、SR2の出力若しくはKEY 10の出力のいずれか一方を選択してTLR3に出力するための入力態様選択手段(SLD)、12は、VOX8を作動させて自動翻訳させるか、またはVOX8を停止させてAS7'を手動操作させるか選択する自動入力阻止スイツチ(SW)であり、SLC 11とSW12とは接点a-a、接点b-bというように連動する。
次に、この装置の動作を説明する。
まず、SLC11を接点aに接続(SW12も接点aに接続)する。
マイク1に“コレワホンデス”というとSR2は、“コレワホンデス”なる文字情報に変換後、SLC 11の接点aを介して、TLR3に送出する。
このとき、SR2の出力は、SW12の接点aを介してVOX8に入力され、“コレワホンデス”の後の1秒間の空白を検出するとVOX8は、AS7'に出力を送出し、AS7'を介してTLR3に翻訳動作を実行させ、“THIS IS A BOOK”なる文字情報をSM4に送出、SM4は、これを“ジス イズ ア ブツク”なる音声情報に変換後、SP5に送出する。
また、SLC 11を接点b(SW12を接点b)に導通させる。そして、KEY 10から“ワタシワトムデス”と入力する。この文字情報は、SLC 11の接点bを介してTLR3に入力される。
このとき、SW12は、接点bに接続きれているので、いっまで待つてもVOX8は、作動しない。したがつて、VOX8に関係なくKEY 10の入力後、1秒未満であつてもAS7'を手動でONすれば、TLR3を作動させ翻訳を実行させて、TRL3から“I AM TOM.”なる出力を得、SM4から“アイ アム トム”なる音声情報をSP5に送出する。
以下、同様の動作をくり返す。
本実施例では、SW12はSLC11と連動するが手動でも切換えることができるので、SLC11を接点aに導通させ(このとき、SW12は自動的に接点aに導通する)、SLC11を接点aに導通させたままで、SW12を手動で接点bに導通させ、VOX8を停止させることにより、マイク1に向つてポツリ、ポツリと考えながら文章を入力し、文の切れ目など翻訳をしたい所でAS7'(この場合、AS7'は手動以外には作動しない)を手動で操作し、自分でタイミングをとりながら翻訳実行指示を行なうことができる。また、手動でなく自動にしたければ、SW12を切換え、接点aに導通させれば、上記同様に自動翻訳を行なうことができる。
尚、上記実施例では、電子翻訳装置の例を示したが、これに限るものではなく、情報処理装置(電子が翻訳装置も、その一つである)についても実施することができ、精度の高い自動処理を実現することができる。
また、上記実施例では、和英翻訳の例を示したが、これに限るものではなく、他の言語、演算などにも実施できる。又、SR、TLR、SM、VOX、ASなどの全部若しくは一部を、LSI、Iチツブマイコンなどで処理するようにしてもよい。
以上のように本発明によれば、認識後の出力中に存在する終端情報を検出した際、情報処理動作を実行させるので、認識前のノイズの多い情報から終端情報を検出する場合に比較して、検出精度を大巾に向上でき、自動処理を確実に行なうことができると共に、認識前の情報から終端情報を検出した場合、認識、手段での認識動作に要する時間遅れ(タイムラグ)を考慮して(例えば、遅延手段を設けるなどして)情報処理手段への実行指示のタイミングを遅らさなければ、情報処理手段に処理実行をAS7'から指示したが、未だ認識手段で認識動作中であつたというのでは、タイミングよく処理を実行させ精度の高い処理済情報を得ることができないのであるが、
本発明のものでは、認識後の情報を終端情報の検出対象としているので、終端情報が検出されたときには、必ず、処理すべき情報は全て情報処理手段に入力されているので、遅延手段などの時間制御手段を要せず、タイミングよく処理動作を自動的に実行させることができる。
図面の簡単な説明
第1図は従来の電子翻訳装置のプロツク図、第2図は、本発明の一実施例である電子翻訳装置のプロツク図、第3図は、同装置の各部出力のタイミングチヤート、第4図、第5図は、本発明の他の実施例のプロツク図である。
2……音声認識手段(SR)、3……電子翻訳手段(TLR)、4……音声合成手段(SM)、7'……実行指示手段(AS)、8……空白検出手段(VOX)。
第1図
<省略>
第2図
<省略>
第3図
<省略>
第4図
<省略>
第5図
<省略>
特許公報
<省略>
<省略>
<省略>